国立国会図書館サーチ(平成22年8月17日開発版)の公開について
2010年8月17日
国立国会図書館サーチ(NDL Search)は、平成24年1月の本格稼働を目指して、インターネットで普及しているサービス、実証実験等で実用化が検証された技術を積極的に採用し、順次、機能強化を行う予定です。
開発段階のシステムですが、これを広く一般の利用者に試行公開することで、ご意見を反映させながら、より利用しやすいシステムに仕上げていきたいと考えています。国立国会図書館サーチ(平成22年8月17日開発版)は、その試行公開の初版のシステムです。
今回公開する開発版で提供できる主なサービスの特徴は次の通りです。
統合検索機能
一次情報の入手手段へのナビゲーション
あいまい検索機能
翻訳機能
現在、34個のデータベースから収集した約5,500万件の文献情報等を検索できます。また、9個のデータベースを横断検索できます。
⇒検索対象は、国立国会図書館、都道府県立図書館、国立情報学研究所、国立公文書館、国立美術館や、民間電子書籍サイト等の、蔵書・出版目録、デジタル資料、レファレンス事例等の43個のデータベースです。この詳細については、検索対象一覧をご覧ください。 |
【使用例】
- 「坊っちゃん」というキーワードを入力すると、国立国会図書館や他の機関で所蔵している『坊っちゃん』という本、「坊っちゃん」に関する記事やレファレンス事例等を検索できます。
- デジタル化された『坊っちゃん』が検索の結果ヒットした場合、詳細画面からデジタル化された『坊っちゃん』が掲載されているページにリンクし、ウェブ上で『坊っちゃん』を閲覧することができます。
- 都道府県立・政令指定都市立図書館、お近くの市町村立図書館での所蔵状況を調べることができます。市町村立図書館の所蔵検索は、カーリルという外部のウェブサービスを利用して実現しています。また、オンライン書店で再検索することができます。
【制約事項】
- 都道府県立・政令指定都市立図書館の蔵書目録(ゆにかねっとの一部)、新聞総合目録、児童書総合目録については、当面更新しません。データの時点は、都道府県立・政令指定都市立図書館の蔵書目録(ゆにかねっとの一部)が平成20年12月、新聞総合目録が平成22年4月、児童書総合目録が平成22年1月です。
- NDL-OPACのうち「点字図書・録音図書全国総合目録」は検索対象に含まれません。また、規格・テクニカルリポート類の大部分、統計書や全集の一部も含まれておりません。
- 児童書総合目録の一部のデータについて、シリーズ名の収録に誤りがあります。これについては早急に更新する予定です。
- アジア言語OPACへの横断検索で一致する書誌データが1件のみの場合は、検索結果が表示されません。なお、表示される情報は簡略書誌ですので詳細はアジア言語OPACへのリンクでご確認ください。
【今後の改良予定】
全文テキスト化された資料に関しては、書誌情報だけでなく、本文の全文検索ができます。 |
【使用例】
【制約事項】
- 平成22年8月17日開発版では、国立国会図書館がホームページ上で公開している資料(『国立国会図書館月報』、『調査と情報』等)のみを全文検索の対象としています。なお、それらの資料の書誌情報(メタデータ)は、PDFファイル等についてはプロパティ、HTMLページについてはTITLEタグ等から付与しています。
【今後の改良予定】
- 全文検索の対象を順次拡大していきます。
- 目次等も検索対象としていきます。
統合検索の結果について、可能な限り入手手段を案内します。 |
【使用例】
- 紙資料、デジタル資料の別を問わず、最適な入手手段(お近くの図書館、Web上のデジタル資源等)にナビゲートします。
- ISBNがある資料の場合は、カーリルでお近くの図書館における所蔵を検索することもできます。
- また、Amazon等のオンライン書店、Googleブック検索等へもナビゲートします。
【制約事項】
- 都道府県立・政令指定都市立図書館の蔵書目録には、詳細画面のURLが特定されていないものがあるため、平成22年8月17日開発版では、各所蔵図書館の蔵書目録のトップページへのリンクとなっております。また、児童書総合目録については、児童書総合目録の「参加館情報」にリンクしています。
自然文検索、あいまい検索、類義語・同義語検索等を用いた検索支援が可能です。 |
【使用例】
- 「経済学を学びたい」といった自然文を入力して検索を行うことができます。この場合は、『ミクロ経済学を学ぶ』といった本がヒットします。 【自然文検索】
- 「泳ぐ」というキーワードで検索を行うと、語形の変化した「泳げば」「泳ごう」等による検索も自動的に行います。 【あいまい検索】
- 「コンピュータ(半角カタカナ)」、「コンピューター」というキーワードで検索を行うと、「コンピュータ(全角カタカナ)」による検索も自動的に行います。 【あいまい検索】
【制約事項】
- 「漢字」「ひらがな」「カタカナ」の相違を吸収した検索はできません。例えば、「林檎」というキーワードで検索を行っても、「りんご」あるいは「リンゴ」による検索は行われません。
- 類義語・同義語検索は、入力したキーワードと類義語・同義語を同時に検索するのではなく、検索結果一覧画面の右に表示される関連キーワードから再検索することで実現しています。
【今後の改良予定】
- 辞書の実装、自動読み振り等により、「漢字」「ひらがな」「カタカナ」の相違を吸収して検索できるようにします。
- 入力したキーワードと同時に類義語・同義語も検索できるようにします。
「日本語 ⇔ 中国語」「日本語 ⇔ 英語」の翻訳検索・翻訳表示ができます。 |
【使用例】
- 「経済特区」というキーワードを、「经济特区」という中国語に翻訳して検索を行います。また、その結果ヒットした『中国经济特区和十四个开放城市 』という本のタイトルを、『中国の経済特区、14開放都市』という日本語に翻訳して表示することができます。
【制約事項】
- 検索結果の翻訳には、Google翻訳を利用しています。そのため、翻訳の精度は、Google翻訳の性能に依存しています。
【今後の改良予定】
- 外部の適切な翻訳サービスを採用することで、翻訳精度を向上させます。また、翻訳対象言語も順次拡大していきます。
- 将来的には、全文情報の翻訳も目指します。
複数の機関で所蔵している同一の資料をまとめて表示します。 |
【使用例】
- 『ぐりとぐら』(福音館書店、1967年)を複数の図書館が所蔵している場合、検索結果一覧では、国立国会図書館所蔵と都道府県立図書館等の所蔵を別々に表示するのではなく、1つの書誌にまとめて表示します。
- 『ぐりとぐら』(福音館書店、1967年)を所蔵している図書館は、詳細画面の右にまとめて表示されます。
【制約事項】
- 同一資料のまとめ表示は、次の同定ロジックに従っています。(詳細は「同定フロー図(PDF)」をご参照ください。)
- 「全国書誌番号」「ISBN」「民間MARC番号」のいずれかが一致するものは同一資料としてまとめて表示する。
- 「タイトル+出版者+出版年」が一致するものは同一資料としてまとめて表示する。
- 上記の①②で同一資料としてまとめて表示されないものは、同一資料がないものとみなし、まとめずそのまま表示する。
- 上記のロジックにより500件以上が同定されてしまう場合は、誤同定であるとみなし、平成22年8月17日開発版にはそれらの書誌は投入していません。この理由から投入していない書誌には、規格・テクニカルリポート類、統計書、全集等が多く含まれます。
- 上記ロジックの精度により、または、各図書館においての「タイトル」「出版者」「出版年」等の記載のばらつきにより、「同一資料でないものがまとめられている場合/同一資料がまとめられていない場合」があります。
【今後の改良予定】
- 同一資料のまとめ表示の実証実験を行い、精度の高いまとめ表示を目指します。
形態を異にする同一著作を隣接した位置に表示します。 |
【使用例】
- 検索結果一覧を「適合度順」に並べると、『アフターダーク』(ハードカバー)と『アフターダーク』(文庫本)が関連資料として隣接表示されます。
- 『アフターダーク』(ハードカバー)の詳細画面を開くと、画面下に関連資料として『アフターダーク』(文庫本)が表示されます。
【制約事項】
- 各図書館によって、タイトル、著者等の記述にばらつきがあるため、関連資料として認識されず、隣接表示されていない場合があります。
【今後の改良予定】
- 関連資料の隣接表示の実証実験を行い、精度の高い隣接表示を目指します。
検索結果は、適合度順(検索語に対する各資料の関連性が高いと思われるものの順)で排列します。 |
【制約事項】
- 適合度を算出するロジックは、国立国会図書館が独自に定めたものです。適合度を算出するために用いている項目は、書誌情報における検索キーワードの個数、密度等です。
- その他に、出版年が新しい順、古い順、タイトル昇順、タイトル降順で検索結果を並べ替えることができます。
【今後の改良予定】
【使用例】
- 「コンピュータ」というキーワードで検索を行ったあと、「事務機械・器具」「スーパーコンピュータ」「ソフトウェア」等の関連キーワードから再検索を行うことができます。関連キーワードは、ウェブ版国立国会図書館件名標目表(Web NDLSH)をもとにして導出しています。
- 「竜馬がゆく」というキーワードで検索を行ったあと、「司馬遼太郎」という著者名キーワードから再検索を行うことができます。著者名キーワードは、国立国会図書館が作成している著者名典拠データをもとにして導出しています。
- 「経済学」というキーワードで検索を行ったあと、「比較制度分析」という連想キーワードから検索を行うことができます。連想キーワードは、GETAssocという外部の連想検索エンジンを利用して導出しています。
【制約事項】
- 連想キーワードの導出精度は、GETAssocの性能に依存します。
- 国立国会図書館の書誌情報をもとにして連想キーワードを導出しているわけではありません。そのため、必ずしもその連想キーワードで再検索できるとは限りません。
【今後の改良予定】
- 国立国会図書館をはじめとする多様な書誌情報を用いることで、より適切な連想キーワードを表示することを目指します。
資料種別、所蔵館等から絞り込み検索を行うことができます。 |
【使用例】
- 検索を行ったあと、データベース、資料種別、所蔵館、出版年、NDC分類から絞り込み検索を行うことができます。
- 検索結果を、「NDL-OPAC」や「近代デジタルライブラリー」等、国立国会図書館サーチ(開発版)が統合検索対象にしている各データベースに絞り込んで検索を行うことができます。
- 検索結果を、「記事・論文」形態のものや「DVD・CD」形態のものに絞り込んで検索を行うことができます。
- 検索結果を、「広島県立図書館」や「大阪市立中央図書館」で所蔵している資料に絞り込んで検索を行うことができます。
- 検索結果を、「1984年」や「2001年」に出版された資料に絞り込んで検索を行うことができます。
- 検索結果を、「4.自然科学」や「9.文学」に絞り込んで検索を行うことができます。分類は、NDC分類をもとに表示しています。
【制約事項】
- データベースを「児童書総合目録」として絞り込み検索を行った結果には、現在稼働中の「児童書総合目録」とは異なり、「児童書総合目録参加館では所蔵しておらず、国立国会図書館でのみ所蔵している資料」が含まれていません。
- 資料によっては、資料種別を正確に識別できていないもの、大まかにしか資料種別を分類していないものがあります。例えば、点字資料は「本・雑誌」、CD-ROMは「DVD・CD」、規格・テクニカルリポート類は「記事・論文」という資料種別に分類されています。
- 出版年や分類による絞り込みは、横断検索対象には対応していません。
【今後の改良予定】
- 資料種別の分類をさらに検討し、利便性の高いものとしていきます。
書誌情報の固定URL表示、Twitterへの投稿機能、検索結果一覧のRSS配信機能等、検索結果を活用するための様々な付帯機能を利用できます。 |
【使用例】
- 検索結果一覧画面や詳細画面に固定URLを付与しているため、それらのページへのリンク、ブックマークができます。
- 書誌詳細画面を、はてなブックマーク等の外部ブックマークサービスでブックマークできます。
- 書誌詳細画面のURLをTwitterへの投稿ができます。
- 特定の検索条件に当てはまる新着書誌情報のRSS配信を受けることができます。例えば、「科学技術」というキーワードが含まれる書誌が新たに追加された場合に、その書誌情報をRSSリーダーで受け取ることができます。
このサービスを他のシステムから利用するための各種標準的なAPIが利用できます。 |
【使用例】
- 各機関の目録システム、デジタルアーカイブシステムに、国立国会図書館サーチを検索するAPIを実装することにより、各機関が保有していない情報へナビゲートできます。
- APIを使って、国立国会図書館サーチが保有するデータをダウンロードし、そのデータを用いて新しいWebサービスを行うことができます。
【今後の改良予定】
- APIについては、ユーザ評価の対象とし、今後、一般ユーザや専門家からいただくご意見を踏まえ、変更を加えていきます。
⇒APIの詳細については、APIについてをご覧ください。