自然言語処理

雑誌「自然言語処理」の発刊にあたって

長尾眞

1994 年1 巻1 号 p. 1
発行日: 1994/10/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.1.1

ジャーナルフリー

PDF形式でダウンロード (96K)
表層表現中の情報に基づく文章構造の自動抽出

黒橋禎夫, 長尾眞

1994 年1 巻1 号 p. 3-20
発行日: 1994/10/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.1.3

ジャーナルフリー

抄録を表示する抄録を非表示にする

テキストや談話を理解するためには, まずその文章構造を理解する必要がある.文章構造に関する従来の多くの研究では, 解析に用いられる知識の問題に重点がおかれていた. しかし, 量的/質的に十分な計算機用の知識が作成されることはしばらくの問期待できない. 本論文では, 知識に基づく文理解という処理を行なわずに, 表層表現中の種々の情報を用いることにより科学技術文の文章構造を自動的に推定する方法を示す. 表層表現中の情報としては, 種々の手がかり表現, 同一/同義の語/句の出現, 2文間の類似性, の3つのものに着目した. 実験の結果これらの情報を組み合わせて利用することにより科学技術文の文章構造のかなりの部分が自動的に推定可能であることがわかった.

抄録全体を表示

PDF形式でダウンロード (1602K)
A Comparative Study of Automatic Extraction of Collocations from Corpora: Mutual Information vs. Cost Criteria

Kenji Kita, Yasuhiko Kato, Takashi Omoto, Yoneo Yano

1994 年1 巻1 号 p. 21-33
発行日: 1994/10/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.1.21

ジャーナルフリー

抄録を表示する抄録を非表示にする

While corpus-based studies are now becoming a new methodology in natural languageprocessing, second language learning offers one interesting potential application. In this paper, we are primarily concerned with the acquisition of collocational knowledge from corpora for use in language learning. First we discuss the importance of collocational knowledge in second language learning, and then take up two measures, mutual information and cost criteria, for automatically identifying or extractingcollocations from corpora. Comparative experiments are made between the two measures using both Japanese and English corpora. In our experiments, the cost criteria measure proved more effective in extracting interesting collocations such as fundamental idiomatic expressions and phrases.

抄録全体を表示

PDF形式でダウンロード (1229K)
並列構造の検出に基づく長い日本語文の構文解析

黒橋禎夫, 長尾眞

1994 年1 巻1 号 p. 35-57
発行日: 1994/10/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.1.35

ジャーナルフリー

抄録を表示する抄録を非表示にする

従来の構文解析法は十分な精度の解析結果を得ることができず, とくに長い文の解析が困難であった. このことは従来の方式が局所的な解析を基本としていたことに原因があり, これを解決するためには文内のできるだけ広い範囲を同時的に調べることが必要である.我々は, すでに, このような考え方に基づき, 長い文の中に多く存在する並列構造が文節列同士の類似性を発見するという手法でうまく検出できることを示した. 本論文では, そのようにして検出した並列構造の情報を利用して構文解析を行なう手法を示す. 長い日本語文の場合は1文内に複数の並列構造が存在することも多い. そこでまず, 文内の並列構造相互間の位置関係を調べ, それらの入れ子構造などを整理する. 多くの場合, 並列構造の情報を整理した形で利用できれば, 文を簡単化した形でとらえることができる. そこで, 簡単化した各部分に対して単純な係り受け解析を行ない, その結果を組み合わせることによって文全体の依存構造を求めることが可能となる.各部分の係り受け解析としては, 基本的に, 係り受け関係の非交差条件を満たした上で各文節が係り得る最も近い文節に係るという優先規則によって決定論的に動作する処理を考えた. 150文に対して実験を行なったところ, 96%の文節について正しい係り先を求めることができた.

抄録全体を表示

PDF形式でダウンロード (7188K)
A System for Finding Translation Patterns by Comparing an MT Result and Its Correction

Hideo Watanabe

1994 年1 巻1 号 p. 59-75
発行日: 1994/10/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.1.59

ジャーナルフリー

抄録を表示する抄録を非表示にする

When the example-based approach is used for machine translation, it is importantto collect a large volume of translation patterns, because most systems use as atranslation example a pair of parsed structures in the source and target languages.Such parsed translation pairs are hard to collect. This paper describes a systemfor finding parsed translation pairs (or translation patterns) that are valid for thetranslation pattern base by comparing wrong translations and corresponding correcttranslations.

抄録全体を表示

PDF形式でダウンロード (1354K)

J-STAGEへの登録はこちら（無料）