自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
日本語
ウイグル語辞書の半自動作成と評価
ムフタル マフスット小川 泰弘杉野 花津江稲垣 康善
著者情報
ジャーナル フリー

2003 年 10 巻 4 号 p. 83-108

詳細
抄録
著者らは, 既存のウイグル語-日本語辞書を基にして, 見出し語数約2万の日本語-ウイグル語辞書を半自動的に作成した. この辞書が日常よく使われる語彙をどの程度含んでいるかなどの特性を調べるために, 国立国語研究所の教育基本語彙6, 104語のうちのより基本的とされている2, 071語, およびEDR日本語テキストコーパスの出現頻度上位2, 056語に対し, 日本語-ウイグル語辞書の収録率を調査し, いずれについても約80%の収録率であることが分かった. 未収録語について, 逐一その理由を調べ, 判明した種々の理由を整理すると共に, それに基づいて未収録語を分類した. その結果, 辞書作成をする時に収録率を上げるために注意すべき点などについていくつかの知見を得ることができた. 本論文では, それらについて述べる.
著者関連情報
© 言語処理学会
前の記事 次の記事
feedback
Top