「知財管理」誌
Vol.55 記事詳細
掲載巻(発行年) / 号 / 頁 | 55巻(2005年) / 12号 / 1769頁 |
論文区分 | 論説 |
論文名 | 過去分公開公報テキストデータの評価方法の検討 |
著者 | 知的財産情報検索委員会第3小委員会 |
抄録 | 過去分(CD−ROM公報以前)公開公報のテキストデータ化が、特許情報提供事業者から種々行われ始めている。これら過去分のテキストは、紙公報をスキャンニング後、OCR処理したものである。事業者によっては、目視確認をしている場合もあるとのことである。しかし、具体的な精度を正式に公表しているものはない。このOCR精度が、テキスト検索精度と直接関係するため、検索者にとって非常に気になるところである。利用する立場からこれら過去分公開公報のテキストデータの信頼性、有用性を検証するための手法を紹介すると共に、これら過去分テキストの検索での使用方法について提案する。 |