自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
2 巻, 3 号
選択された号の論文の5件中1~5を表示しています
  • 江原 暉将
    1995 年 2 巻 3 号 p. 1
    発行日: 1995/07/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 宮崎 正弘, 白井 諭, 池原 悟
    1995 年 2 巻 3 号 p. 3-25
    発行日: 1995/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    三浦文法は、時枝誠記により提唱され三浦つとむにより発展的に継承された言語過程説に基づく日本語文法である。言語過程説によれば、言語は対象-認識-表現の過程的構造をもち、対象のあり方が話者の認識を通して表現されている。本論文では、三浦文法に基づいて体系化した日本語品詞体系および形態素処理用の文法記述形式を提案し、日本語の形態素処理や構文解析におけるその有効性を論じた。日本語の単語を、対象の種類とその捉え方に着目し、約400通りの階層化された品詞に分類して、きめ細かい品詞体系を作成した。本論文で提案した品詞体系と形態素処理用文法記述形式に基づき、実際に形態素処理用の日本語文法を構築した結果によれば、本文法記述形式により例外的な規則も含めて文法を簡潔に記述できるだけでなく、拡張性の点でも優れていることが分かった。本品詞体系により、三浦の入れ子構造に基づく意味と整合性の良い日本語構文解析が実現できるものと期待される。
  • Eiichiro Sumita, Kozo Oi, Osamu Furuse, Hitoshi Iida, Tetsuya Higuchi
    1995 年 2 巻 3 号 p. 27-48
    発行日: 1995/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    This paper proposes an Example-Based Approach (EBA) using Associative Processors (APs) for machine translation, especially speech-to-speech translation, that requires (1) high accuracy and (2) a quick response. EBAs translate by mimicking the best-match translation examples (hereafter, “examples”), which are derived from corpora. These approaches are known to perform structural disambiguation, target word selection, and whole translation accurately. Therefore, EBAs fulfill the first requirement. The second requirement is also fulfilled by an EBA using APs as follows. The central mechanism of EBAs, Example-Retrieval (ER), retrieves the examples most similar to the input expression from an example database. ER becomes the dominant component as the size of the example database increases. We have parallelized ER by using APs consisting of an Associative Memory and a Transputer. Experimental results show that ER can be drastically accelerated by our method. Moreover, a study of communication among APs and an extrapolation from the sustained performance of 10APs demonstrate the scalability of our method against the size of the example database. Consequently, the EBA using APs meets the critical requirements of machine translation.
  • 田中 英輝
    1995 年 2 巻 3 号 p. 49-72
    発行日: 1995/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    機械翻訳システムでは動詞の訳語を選択するために格フレームがよく利用される. 格フレームは従来主として人手で記述されていたが, 一貫性を保って記述するのが難しいこと, 格フレームを部分的に変更した場合に起こる影響が把握しにくいことなどの重大な問題があった. そこでこれらの問題を解決するため, 本論文では格フレームを決定木の形で表し (これを格フレーム木と呼ぶ), これを英日の対訳コーパスから統計的な帰納学習プログラムを利用して学習することを提案する. 本論文ではまず, この提案によって上記の問題が軽減される根拠を述べた後, 本論文で作成した英日対訳コーパスについて述べる. 続いて7つの英語動詞について格フレーム木の獲得実験を2つ報告する. 最初の実験は, 格要素の制約として英語の単語を使う格フレーム木を学習したものである. これにより得られた格フレーム木を観察したところ, 人間の直観に近く, かつ直観を越えた非常に精密な訳し分けの情報が得られたことが明らかになった. 次に, この格フレームの一般性を高めるために, て格フレーム木を学習する実験を行った. 得られた格フレーム木で未学習のデータの動詞の訳語を決定する評価を行ったところ, 2. 4%ないし32. 2%の誤訳率が達成された. この誤訳率と, 先の英語単語を利用した格フレーム木での誤訳率との差は13. 6%ないし55. 3%となり, 意味分類コードが有効に機能したことが示された.
  • 新納 浩幸, 井佐原 均
    1995 年 2 巻 3 号 p. 73-86
    発行日: 1995/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では「目を盗む」や「かたずを飲む」などの述語型定型表現をコーパスから自動抽出することを目的に, 従来の相互情報量の条件を緩める方向で, 名詞動詞間の共起性を測る新たな基準を提案する. 概略, 名詞, 動詞のどちらかを固定して, その単語と共起する集合内の各単語に, どの程度特異な頻度になっているかの数値を与える. この数値は集合内のその単語の頻度の割合と, 集合内の単語の種類数から計算される. この数値の上位のものを取り出すことで定型表現の抽出を行う. 本手法の特徴は, 名詞を固定した場合に抽出できる表現と, 動詞を固定した場合に抽出できる表現はほとんど共通のものがなく, しかもどちらの場合も相互情報量による抽出程度の正解率を得られることである. このため, 目的の抽出数の半数つつを名詞固定と動詞固定の各々の場合から取り出せば, 相互情報量を用いて抽出する場合よりも高い正解率が得られる.
feedback
Top