単語知識を必要としない高精度な言語モデル

森 大毅; 阿曽 弘具; 牧野 正三

doi:10.5715/jnlp.6.2_29

抄録

本論文では, 知識に依存しない, 高い曖昧性削減能力を持つ新しい言語モデルを提案する. このモデルはsuperwordと呼ぶ文字列の集合の上のn-gramとして定義され, 従来の単語や文字列のn-gramモデルを包含するものになっている. superwordは訓練テキスト中の文字列の再現性のみに基づいて定義される概念であり, Forward-Backwardアルゴリズムによって学習される. 実験の結果, superwordに基づくモデルと文字のtrigramモデルを複数融合させたモデルの優位性が示され, 形態素解析に基づく方法および高頻度文字列に基づく方法を上回る性能が得られた.

著者関連情報

お気に入り & アラート

お気に入りに追加
追加情報アラート
被引用アラート
認証解除アラート

閲覧履歴

Equalization for the dummy-head-headphone system capable of reproducing true directional information
Coupling Analysis of Dynamics and Oil Film Lubrication on Rotor - Floating Bush Bearing System
サトウキビ生育の極初期段階におけるバイオマス生産特性
Decision-making on Increasing Limestone Content of General Purpose Cement

責任著者(Corresponding author)

J-STAGEへの登録はこちら（無料）