自然言語処理

他分野に目を向けよう

浦谷則好

1999 年 6 巻 5 号 p. 1-2
発行日: 1999/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.5_1

ジャーナルフリー

PDF形式でダウンロード (193K)
音節連鎖特性に着目した対話文の言い直し表現の抽出法

荒木哲郎, 池原悟, 橋本昌東

1999 年 6 巻 5 号 p. 3-26
発行日: 1999/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.5_3

ジャーナルフリー

抄録を表示する抄録を非表示にする

会話文では, 言い直しなどの冗長な表現が含まれ, 解析を困難にしている. 本論文では, 言い直し表現は繰り返し型が多く, また, 文節境界に挿入されやすいことに着目して, べた書きで音節標記された会話文を対象に, これを抽出する方法を提案した. 提案した方法は, 言い直しを含んだべた書き音節列をマルコフ連鎖モデルを用いて文節単位に分割する処理と, それによって得られた文節境界を手がかりに文節間の音節列の類似性を評価して言い直し音節列を抽出する処理の2つの処理から構成される. 具体的には, 第1の処理では, 言い直しの表現を含む文節境界の推定に適した文節境界推定法を提案し, 第2の処理では, 文節境界の使い方の異なる3つのマッチングの方法を提案した. また, これらの2つの方法を組み合わせたときの言い直し表現の抽出精度を計算によって推定すると共に, その結果を総合的な実験結果と比較して提案した方法の効果を評価した. ATRの「旅行に関する対話文」のコーパス (その内, 言い直しは106個所) を用いて実験評価した結果によれば, 言い直し表現の抽出精度は第2の処理の方法に強く依存し, 再現率を重視する場合は, 再現率80.2% (その時, 適合率84.2%), また, 適合率を重視する場合は, 適合率94.9% (その時, 再現率52.8%) の精度が得ちれることが分かった.

抄録全体を表示

PDF形式でダウンロード (3583K)
比喩理解における顕著な属性の発見手法

今井豊, 石崎俊

1999 年 6 巻 5 号 p. 27-42
発行日: 1999/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.5_27

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文では, 二つの名詞概念からなる比喩表現における顕著な属性を自動的に発見する手法を提案する. まず, 概念から連想される属性について調べる連想実験を行い, 次に, その結果に基づく属性の束を作ってSD法の実験を行う. そして, SD法実験の評定値をパラメータとして用いるニューラルネットワークを使用して, 二つの概念に共通でしかも顕現性の高い属性を抽出する. この手法では多数の属性問の顕現性に関する数値的な順序づけが行われるので, 多様な概念の組み合わせを含む「TはVだ」の形の比喩表現に対して適用できる. ここで, Tは被喩辞, Vは喩辞である. 本手法を用いたシステムによる実行例を示し, その有効性を検証する.

抄録全体を表示

PDF形式でダウンロード (1408K)
論文間の参照情報を考慮したサーベイ論文作成支援システムの開発

難波英嗣, 奥村学

1999 年 6 巻 5 号 p. 43-62
発行日: 1999/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.5_43

ジャーナルフリー

抄録を表示する抄録を非表示にする

本稿では, データベースから関連する論文を自動的に収集し, 人間が特定分野のサーベイ論文作成する作業を支援するシステムを示す. 本研究では, サーベイ論文作成支援の際, 論文の参照情報に着目する. 論文の参照情報とは, 論文中でその論文と参照先論文との関係について記述されている箇所 (参照箇所) から得られる情報のことで, 参照先論文の重要点や, 参照元と参照先論文問の相違点を明示する有用な情報が得られる. サーベイ論文作成には2つの処理 (1) 特定分野の論文の収集 (2) 論文問の相違点の検出が必要であると考えられる. 本研究では参照情報を利用することでこれらの処理が部分的に実現可能であることを示す. 具体的には, ある論文が他の論文を参照する時の参照の目的を, cue wordを用いて解析し, 論文の参照・被参照関係にリンク属性 (参照タイプ) を付与する. 結果として, 参照箇所抽出ではRecall 79.6%, Precision 76.3%の精度が得られた. また, 参照タイプ決定では83%の精度が得られた. これらの参照タイプを利用し, ある特定分野の論文を自動的に収集するのに近い処理が可能になった. また, ユーザに論文間の参照関係を表すグラフ, グラフ中の個々の論文のアブストラクト, 論文問の相違点の記述された参照箇所を提示するシステムを構築した. このシステムを利用することで特定分野の論文が自動収集され, また収集された論文集合の論文間の相違点が明らかにされるため, 参照情報がサーベイ論文作成の支援に有用であることが示された.

抄録全体を表示

PDF形式でダウンロード (4924K)
構成素境界解析を用いた多言語話し言葉翻訳

古瀬蔵, 山本和英, 山田節夫

1999 年 6 巻 5 号 p. 63-91
発行日: 1999/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.5_63

ジャーナルフリー

抄録を表示する抄録を非表示にする

表層パタンの照合を行なう構成素境界解析を提案し, 構成素境界解析と用例利用型処理を組み合わせた変換主導型機械翻訳の新しい実現手法が多言語話し言葉翻訳に有効であることを示す. 構成素境界解析は, 変項と構成素境界より成る単純なパタンを用いた統一的な枠組で, 多様な表現の構文構造を記述できる. また, 構成素境界解析は, チャート法に基づくアルゴリズムで逐次的に入力文の語を読み込み, 解析途中で候補を絞り込みながらボトムアップに構文構造を作り上げることにより, 効率的な構文解析を可能にする. 構成素境界解析の導入により, 変換主導型機械翻訳は構文構造の記述力, 構文解析での曖昧性爆発といった, 頑健性や実時間性の問題を解決することができた. さらに, 構成素境界解析と用例利用型処理は単純で言語に依存しない手法であり, 多言語話し言葉翻訳へ適用するための汎用性を高めることができた. 旅行会話を対象とした日英双方向と日韓双方向の話し言葉翻訳の評価実験の結果により, 本論文で提案する変換主導型機械翻訳が, 多様な表現の旅行会話文を話し手の意図が理解可能な結果へ実時間で翻訳できることを示した.

抄録全体を表示

PDF形式でダウンロード (2630K)
放送ニュース文を対象とした効果的類似用例検索法

田中英輝, 熊野正, 浦谷則好, 江原暉将

1999 年 6 巻 5 号 p. 93-116
発行日: 1999/07/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.5_93

ジャーナルフリー

抄録を表示する抄録を非表示にする

著者らは用例提示型の日英翻訳支援システムを開発している. この中には利用者が入力する日本語の表現に類似する表現を検索して, 検索結果を含んだ日本語文とその対訳を表示する機能がある. 著者らの日本語データベースの文は平均長が88.9文字と長い. このように長い用例を対象に類似検索を行う場合, キーワードによるAND検索は適切ではない. なぜなら用例が長いため1文中に同一キーワードが複数回出現する場合があり, これが原因で不適切な用例を検索しやすくなるからである. これに対して著者らは入力キーワードの語順とその出現位置の間隔を考慮した検索手法を提案する. これによって構文解析を行うことなく構文情報を反映した検索を行うことができる. 本稿では従来のAND検索と提案手法を使った評定者による主観評価実験を報告する. この中で, 提案手法の有効性が統計的に有意となったことを示す. また, 検索時間の増加は1.3倍であった.

抄録全体を表示

PDF形式でダウンロード (2427K)

J-STAGEへの登録はこちら（無料）