自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
7 巻 , 3 号
選択された号の論文の6件中1~6を表示しています
  • 中川 裕志
    2000 年 7 巻 3 号 p. 1-2
    発行日: 2000/07/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 五百 川明, 宮崎 正弘
    2000 年 7 巻 3 号 p. 3-21
    発行日: 2000/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, GLR法に基づく痕跡処理の手法を示す. 痕跡という考え方は, チョムスキーの痕跡理論で導入されたものである. 痕跡とは, 文の構成素がその文中の別の位置に移動することによって生じた欠落部分に残されると考えられるものである. 構文解析において, 解析系が文に含まれる痕跡を検出し, その部分に対応する構成素を補完することができると, 痕跡のための特別な文法規則を用意する必要がなくなり, 文法規則の数が抑えられる. これによって, 文法全体の見通しが良くなり, 文法記述者の負担が軽減する. GLR法は効率の良い構文解析法として知られるが, 痕跡処理については考慮されていない. 本論文では, GLR法に基づいて痕跡処理を実現しようとするときに問題となる点を明らかにし, それに対する解決方法を示す. 主たる問題は, ある文法規則中の痕跡の記述が, その痕跡とは関係のない文法規則に基づく解析に影響を与え, 誤った痕跡検出を引き起す, というものである. 本論文で示す手法では, この問題を状態の構成を工夫することで解決する.
  • 井佐原 均, 神崎 享子
    2000 年 7 巻 3 号 p. 23-37
    発行日: 2000/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    日本語連体修飾要素に関する言語現象を取り扱うことができるような辞書記述を実現するため, 生成的辞書理論を用いた連体修飾要素の形式的記述法の検討を行った. 問題となる現象の解決法を「静的な曖昧性解消」と「動的な曖昧性解消」に分類した. 静的な曖昧性解消は辞書中の語彙情報を用いて行うことができるが, 動的な曖昧性解消には知識表現レベルでの推論が必要となる.
  • 山下 達雄, 松本 裕治
    2000 年 7 巻 3 号 p. 39-56
    発行日: 2000/07/10
    公開日: 2011/06/07
    ジャーナル フリー
    形態素解析処理において, 日本語などのわかち書きされない言語と英語などのわかち書きされる言語では, 形態素辞書検索のタイミングや辞書検索単位が異なる. 本論文ではこれらの言語で共通に利用できる形態素解析の枠組の提案と, それに基づいた多言語形態素解析システムを実装を行った. また, 日本語, 英語, 中国語での解析実験も行った.
  • 小川 泰弘, ムフタル マフスット, 杉野 花津江, 外山 勝彦, 稲垣 康善
    2000 年 7 巻 3 号 p. 57-77
    発行日: 2000/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    日本語とウイグル語は共に膠着語であり, 構文的に類似した点が多い. したがって. 日本語からウイグル語への機械翻訳においては, 形態素解析によって得られた各単語を逐語翻訳することにより, ある程度の翻訳が可能となる. しかし, 従来の日本語文法は動詞が活用することを前提としていたため, ウイグル語への翻訳の前に, 動詞の活用処理が必要であった. 本論文では, 日本語, ウイグル語を共に派生文法で記述することにより, 日本語の活用処理を不要とすると同時に, 両言語間の形態論的類似点を明確にし, 単純でかつ体系的な機械翻訳が可能になることを示す, しかし, 日本語とウイグル語との問の文法的差異から, 単純な逐語翻訳では不自然な翻訳となる場合がある. 本論文では, 単語間の接続関係を考慮した訳語置換表を用いることによりこの問題を解決し, より自然な翻訳を実現した. さらに, この手法に基づく日本語-ウイグル語機械翻訳システムを作成した. このシステムでは, 日本語形態素解析システムとウイグル語整形システムを, それぞれ独立のモジュールとして構成している. この設計は, 他の膠着語間における翻訳にも応用可能であると考えられる. また, 実験によりその翻訳精度を評価した. 本論文では, 特に両言語において文の中心的役割を果たす動詞句の翻訳について述べる.
  • 菊井 玄一郎
    2000 年 7 巻 3 号 p. 79-96
    発行日: 2000/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    文章に付与されたキーワード集合のような内容語 (ターム) の並びを「タームリスト」と呼ぶ. 本論文では, 翻訳先言語のコーパスのみを用いて, 各タームに対する訳語候補のなかから最適なものを選択する「翻訳多義解消」の新たな方法を提案する. 本手法では, 各タームに対する訳語候補を一つずつ集めてできる組み合わせのうち, 含まれる訳語同士の意味的関連性が最も高い組を選択する. 単語間の意味的関連性の尺度は各単語が翻訳先言語コーパスにおいてどの程度近い文脈に出現するかを数値化したものである. 翻訳実験の結果, 翻訳多義のある単語に対する平均正解率77.4%を達成した.
feedback
Top