ニューラル機械翻訳(NMT)の登場により機械翻訳のパラダイムは大きく変化した。平均的な翻訳精度は統計的機械翻訳(SMT)と比較すると格段に向上したが,誤りの傾向がSMTとは大きく異なっており,NMT特有の誤りも存在する。本稿では機械翻訳研究の歴史をごく簡単に振り返り,SMTの仕組みを簡単に復習した後,SMTと比較しながらNMTの仕組みを解説する。NMTは大きく分けてエンコーダー,アテンション機構,デコーダーの3つからなり,それぞれの役割についても解説する。またそれぞれの翻訳方式の特徴を明らかにし,その長所と短所を説明する。さらに科学技術振興機構(JST)におけるNMTの活用事例を紹介し,最後に本稿のまとめを行う。
DBpediaは主にWikipediaから構造化データセットを抽出してリンクトデータとして再公開するコミュニティープロジェクトである。まず,DBpediaやDBpedia日本語版の成り立ちについて解説する。その後にデータモデルやデータ抽出といったDBpediaの技術的側面について述べる。現在日本語版のトリプル数は1.1億程度である。また,Wikipedia内でのテンプレート出現数に対するマッピングのカバー率は49.1%である。日本語版の利用調査を2015~2016年にかけて行った結果,日本語版にリンクするデータセットが18件,日本語版のアプリケーションが26件,研究利用が65件あることがわかった。また,DBpediaとウィキデータの関係も述べる。
日本内科学会は1903年創立当初から英文誌を刊行し,今日までに1万本を超える論文を発行してきた。現在は,月2回・年24回発行し,J-STAGEによりオープンアクセス誌として公開している。2005年の論文投稿・査読オンラインシステム導入および電子ジャーナル化以降,海外を中心に,予想を上回るほど投稿論文数が大幅に増加した一方で,さまざまな問題点・課題が表面化することとなった。本稿では,表面化した問題点・課題,その克服への取り組み,さらには今後の展望について紹介する。
IoT(Internet of Things)とCPS(Cyber Physical Systems)は共に,物理的な世界とサイバー空間とを融合させることで,世の中に新しい価値を生み出す。本記事では,まず,IoTとCPSに関して,国内外の企業や政府等における具体的な事例を紹介する。次に,第5期科学技術基本計画において,その実践が提唱された「超スマート社会」(Society 5.0)と,その実現に向けたプラットフォームの概要について述べる。さらに,その基盤となる技術の体系化を行い,CRDS(研究開発戦略センター)が作成した研究開発の俯瞰報告書を踏まえて,今後の研究開発課題について述べる。
インターネットという情報の巨大な伝送装置を得,おびただしい量の情報に囲まれることになった現代。実体をもつものの価値や実在するもの同士の交流のありようにも,これまで世界が経験したことのない変化が訪れている。本連載では哲学,デジタル・デバイド,サイバーフィジカルなどの諸観点からこのテーマをとらえることを試みたい。「情報」の本質を再定義し,情報を送ることや受けることの意味,情報を伝える「言葉」の役割や受け手としてのリテラシーについて再考する。
第3回は,伝承の匿名空間とでも呼ぶべきインターネット上に流布される「虚偽情報」にだまされないための方法はあるのか,を考える。