今月号の特集は,2013年1月号の特集「『検索』のゆくえ」の続編として企画しました。前回特集では,検索という行為が浸透した現代において,検索でヒットしない情報はもはや“情報”ではないとみなされるのではないかと懸念を示し,マルチメディア検索の発展,SNSの普及による情報収集行動の変化にも言及しつつ,“検索”の意義を問い直しました1)。
その後,文献の電子化及びオープンデータ化が加速する中,OCR(光学的文字認識)処理技術の進展や法改正により,国立国会図書館所蔵資料のデジタル化画像から作成した全文テキストデータの検索機能が提供されたことで,検索可能な日本語データは革命的に増加しました。また,画像や音声による検索の普及,ChatGPT等の生成AIを活用した検索の登場等,検索手段は一層多様化しています。一方で,生成AIを通じた検索はハルシネーションに注意を要したり,アプリやSNSはクローズドで外部(検索エンジンや非ログインユーザー)からの検索が困難だったりして,便利に見えるようで実は従来イメージされる“検索”によってリーチできる情報は相対的に減ったのではないかという危惧があります。
そこで本特集記事では,近年の検索技術の進展やその特徴を踏まえて,“検索”できる情報や“検索”という行為がどう変わったのか,それによって検索システムやユーザー行動がどのように変化するのかを検討していただきました。
まず,一般社団法人情報科学技術協会会長の清田陽司様には,1970年代頃から現代に至るまでの情報検索技術の進展について概観していただいた上で,技術の実務応用における課題と今後の展望をまとめていただきました。続いて,一橋大学ソーシャル・データサイエンス研究科の欅惇志様にキーワード検索と自然言語検索を比較しながらその特徴を解説するとともに,自然言語検索が普及した経緯や技術発展について,大規模言語モデルの検索拡張生成にも触れながら論じていただきました。次に,国立国会図書館の川島隆徳様と青池亨様,同志社大学免許資格課程センターの原田隆史様に,国立国会図書館サーチのアクセスログ分析結果からユーザーに有効と考えられる,LLM等を用いた検索技術による検索機能の評価と,調べ方を案内するリサーチ・ナビへの誘導機能をご紹介いただきました。エルゼビア・ジャパン株式会社柿田佳子様には,生成AIを搭載した抄録・引用文献データベースScopus AIの開発経緯と,ユーザーである科学コミュニティからの反応やそ共通点をご紹介いただきました。また,筑波大学ビジネスサイエンス系の吉田光男様に,ソーシャルメディアによる情報収集の利点と課題について,エコーチェンバーの影響とその抑制の方策に触れながら論じていただきました。
読者の皆様におかれましては,本特集記事を“検索”という行為について再考する一助にしていただければ幸いです。
(会誌編集担当委員:森口 歩(主査),青野正太,赤山みほ,大澤紗都,野村周平)
1) 立石 亜紀子ほか.特集:「『検索』のゆくえ」の編集にあたって.情報の科学と技術.2013,vol.63,no.1,p.1.
情報検索技術は,単純なキーワードマッチングから,意味を理解した検索へと進化してきた。本稿では,1970年代頃のTF-IDFベースのベクトル空間法から,現代のニューラルネットワーク技術に至る技術進化を概観する。特に,Word2Vecの登場により実現した単語の分散表現に着目し,単語の意味的関係性を数値的に扱うことを可能にした技術的革新について詳述する。分散表現により,同義語や関連語を適切に扱えるようになり,より柔軟な検索が実現している。また,大規模言語モデルの登場により,より深い文脈理解に基づく検索も可能になってきている。
自然言語検索とは,日常会話で用いる自然言語を用いた検索を指し,従来のキーワードを用いた検索と対を成す検索パラダイムである。本記事では近年急速に普及した自然言語を用いた検索について,キーワード検索との対比をしつつその特徴を解説する。また,自然言語検索が普及した経緯を考察し,その要因の一つである深層学習技術を用いた自然言語処理技術の発展の流れについて述べる。最後に,近年注目のトピックである,大規模言語モデルに検索モジュールを組み込んだ検索拡張生成についても紹介する。本記事を通じて,自然言語検索の概要の理解を深めることを目指す。
国立国会図書館サーチのログ分析を行った結果,単純なキーワードによって検索するユーザと,検索条件を組み合わせて検索するユーザが観測され,その割合は半々程度であった。この2つのユーザ類型に即して検索方式を検討した結果,前者のユーザについては,大規模言語モデル(LLM)等を利用した曖昧検索も有効と考えられる。LLM(large-scale language model)を利用するRAG(Retrieval-Augmented Generation)はコスト等の課題が大きいが,RAGの構成要素の一部分を利用したベクトル近傍検索には実用可能性があることが確認できた。後者のユーザについては,欠点もある曖昧検索よりも,調べ方を案内する機能が重要であると考えられ,そのための記事推薦機能の有用性について論じる。
本稿では,生成AIの登場が研究における文献検索に与える影響を示す一例として,Scopus AIという生成AIツールの開発背景や科学コミュニティからの反応を開発者の視点で紹介する。Scopusは,従来の文献検索ツールとしての価値を維持しつつ,Scopus AIを追加することによって新たな顧客価値を提供する可能性を広げている。論文そのものを見つける検索から,膨大な量の論文に基づいた示唆や提案への進化の一端を紹介することで,生成AIがもたらす未来について考察する際の一助となることを期待する。
ソーシャルメディアは,迅速な情報伝達,多様な視点の共有,手軽なアクセスが可能な情報収集ツールとして,現代社会の多くの場面で活用されている。災害対応や政策立案などで重要な役割を果たす一方,アルゴリズムによる情報の選別がエコーチェンバー現象を引き起こし,偏った情報環境を形成する懸念が指摘されている。本稿では,ソーシャルメディアの持つ可能性と課題を整理し,その利点を活かしつつ,エコーチェンバー現象や誤情報の拡散,プライバシー侵害といった問題への対応が求められる現状を論じる。これにより,ソーシャルメディアをより健全かつ効果的に活用するための指針を探る。
本研究は,デンマークの再生可能エネルギー企業オーステッド(Ørsted)社(以下O社)の石油・ガス事業から再生可能エネルギー事業への事業転換における知的財産戦略の役割とその成功要因を明らかにすることを目的とする。2000年から2017年にかけての特許戦略,技術ライセンス,M&A活動を分析し,競合であるRWEとの比較を行った。結果として,O社は早期に市場参入し,オープンイノベーションや特許取得を通じて競争優位を築いたことが確認された。また,O社の知財戦略が洋上風力発電市場の拡大に貢献したことが示唆され,無形資産のうち知財が事業転換における重要な要素であることが示された。本研究はまた,鮫島と小林が提唱する「技術のコモディティ環境下における事業戦略」モデルでの考察を通じて,再生可能エネルギー分野における知財の役割を再評価するものである。
G7仙台科学技術大臣会合コミュニケによる即時OAの推進や,科研費でのDMPの推奨,また,研究機関での研究データ管理公開ポリシーの策定など,研究データ管理の推進の動きが急速に高まってきている。この情勢の中,研究データ管理支援を限られた人材で効率的に実施するために,研究データ管理をそれぞれの立場で学ぶ教材の整備は喫緊の課題である。本稿では,AXIES-RDM部会とJPCOARにより制作された情報基盤系教職員向け研究データ管理支援教材について,そのユースケース,及び,現在得られている本教材への意見を紹介し,今後の課題について述べる。