メインページ > 国立国会図書館サーチについて > 国立国会図書館サーチのシステムについて

国立国会図書館サーチのシステムについて


国立国会図書館サーチでは、オープンソースの統合図書館システムであるNext-L Enjuをコアに、Heritrix、Hadoop、GETAssoc、WordPressといったOSS(オープンソフトウェア)を活用してシステムを構築しています。開発したソフトウェアは、将来的にはOSSとして公開し、公共図書館等での利用に供することを想定しています。また、OSS以外にも、他機関で行われている研究開発の成果や商用サービスを実験的に取り入れています。

1. OSSのご紹介


国立国会図書館サーチが活用した代表的なOSSをご紹介します。

  • Next-L Enju
  • 国立国会図書館サーチでは、検索機能、検索画面、外部提供インタフェース等のベースとして、Next-L Enjuを使用しています。Next-L Enjuは、日本国内で図書館システムの設計・開発を行ない全国に普及を図るプロジェクトであるProject Next-Lでの議論をもとに実装を行なっている、オープンソースの統合図書館システムです。詳細は、Project Next-L WikiNext-L Enjuのプロジェクトページをご覧ください。

  • Hadoop
  • 国立国会図書館サーチでは、データ変換、書誌同定処理、グループ化処理、インデックス作成に、オープンソースの分散コンピューティングソフトウェアであるHadoopを使用しています。Hadoopの分散処理機構により、高速・効率的に処理を行なっています。詳細はHadoop(Apacheのページ)をご覧ください。

  • GETAssoc
  • 国立国会図書館サーチでは、連想キーワードの抽出に、連想検索エンジンGETAssocを使用しています。GETAssocは、国立情報学研究所連想情報学研究開発センターで開発されたオープンソースソフトウェアです。詳細については、連想検索エンジンGETAssoc公開サイトをご覧ください。

  • Heritrix
  • 国立国会図書館サーチでは、国立国会図書館ホームページのテキスト情報収集に、オープンソースのウェブサイトクローラシステムであるHeritrixを使用しています。詳細はHeritrix(Internet Archiveのページ)をご覧ください。

    国立国会図書館サーチのシステム構成については、下の図をご覧ください。



    2. 他機関の研究開発成果のご紹介


    国立国会図書館サーチが活用した他機関の研究開発成果をご紹介します。

  • 日中・中日言語処理技術の開発研究 (NICT)
  • 国立国会図書館サーチでは、検索語の「日本語⇒中国語」の翻訳に、独立行政法人 情報通信研究機構(NICT)で行われている研究開発「日中・中日言語処理技術の開発研究」の成果である機械翻訳機能を使用しています。詳細については、NICT「日中機械翻訳システムの開発」のページをご覧ください。

    3. 商用サービスのご紹介


    国立国会図書館サーチが活用した商用サービスをご紹介します。

  • J-SERVER (高電社)
  • 国立国会図書館サーチでは、平成22年度に日中韓翻訳機能の実証実験を行い、「2.他機関の研究開発成果のご紹介」で紹介したNICTの日中・中日言語処理技術の開発研究の成果の他に、株式会社 高電社の「J-SERVER」というサービスを利用しています。詳細については、高電社の「J-SERVER」紹介ページをご覧ください。

    前のページへ戻る