人工知能学会全国大会論文集
Online ISSN : 2758-7347
第23回 (2009)
セッションID: 3B3-1
会議情報

Wikipediaからの対訳用語対の抽出
*岡崎 直観劉 瀟綱川 隆司辻井 潤一
著者情報
会議録・要旨集 フリー

詳細
抄録

ウィキペディアでは,同一の実体を複数の言語で説明することがあり,それらのエントリ間は言語横断リンクで結ばれる.そこで,本研究では言語横断リンクで結ばれたエントリ同士を並行コーパスと見なし,対訳用語対をマイニングする.提案手法は,単一言語に対して用語抽出を行い,その用語に対する訳語を,統計的機械翻訳に基づく翻訳確率,並行コーパス中における共起回数,言語を横断した用語周辺文脈の類似度で選出する.

著者関連情報
© 2009 一般社団法人 人工知能学会
前の記事 次の記事
feedback
Top