自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
7 巻, 4 号
選択された号の論文の14件中1~14を表示しています
  • 郡司 隆男
    2000 年 7 巻 4 号 p. 1-2
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 東条 敏
    2000 年 7 巻 4 号 p. 3-24
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿の目的は自然言語の時間の相-アスペクト-に対し, 個別の言語から独立した論理的意味を与えることである. 近年のアスペクトの意味論では, アスペクトは共通のイベント構造に対してその異なる部位にレファランスを与えるものであると説明される. 本稿でもまずこの理論を概観するが, その際アスペクトの形式化において常に問題となる用語および概念の混乱を, 本稿で扱う範囲で整理・統合する. 次に従来的な点と区間の論理に代わってアロー論理を導入し, アローを両端が固定されない向きをともなった時間区間であるとしてアスペクトの解析に適用する. アローを含む動的論理はそれ自身既にアローとその端点の関係が含まれる上に, 論理の側で順序や包含の関係が表現できるために, 従来的な述語論理によるアスペクトの形式化に比べてはるかに簡潔な表現が可能である. さらにアローと時点の関係をつけることで, 時間的に束縛されていない事象の原型がアスペクトを伴う表現にシフトされる過程を動的な推論規則として説明できる.
  • 山本 和英
    2000 年 7 巻 4 号 p. 25-62
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    韓国語の言語処理, 特に韓国語を原言語もしくは目的言語とする機械翻訳における, 韓国語の言語体系と形態素処理手法を提案する. 本論文の韓国語体系の特徴は, 機械処理を考慮した体系であるという点にある. すなわち, 形態素解析の解析精度や機械翻訳における品詞設定の必要性に応じて, 韓国語各品詞に対して仕様の検討を行ない, 設計を行なった. また分かち書きや音韻縮約といった韓国語の特徴をどのように機械処理すべきかについても述べる. 韓国語形態素解析では, 品詞と単語の混合n-gramによる統計的手法を基本としながら, 韓国語固有の問題に対しては残留文字などの概念を導入するなどして独自の対応を施した. 以上の品詞体系と形態素解析エンジンによって, 単語再現率99.1%, 単語適合率98.9%, 文正解率92T6%という良好な解析精度が得られた. また韓国語生成処理では, 特に分かち書き処理についてどのような規則を作成したのかについて提案を行なう. 以上の形態素体系と処理の有効性は, 機械翻訳システムTDMTの日韓翻訳, 韓日翻訳部に導入した際の翻訳精度という形で文献 (古瀬, 山本, 山田1999) において報告されている.
  • 望月 源, 奥村 学
    2000 年 7 巻 4 号 p. 63-77
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    電子化テキストの増大にともない, テキスト自動要約技術の重要性が高まっている. 近年, 情報検索システムの普及により, 検索結果提示での利用が, 要約の利用法として注目されている. 要約の利用により, ユーザは, 検索結果のテキストが検索要求に適合しているかどうかを, 素早く, 正確に判定できる. 一般に情報検索システムでは, ユーザの関心が検索要求で表わされるため, 提示される要約も, 元テキストの内容のみから作成されるものより, 検索要求を反映して作成されるものの方が良いと考えられる. 本稿では, 我々が以前提案した語彙的連鎖に基づくパッセージ抽出手法が, 情報検索システムでの利用を想定した, 検索要求を考慮した要約作成手法として利用できることを示す. 語彙的連鎖の使用により, 検索要求に関連するテキスト中のパッセージを要約として抽出できる. 我々の手法の有効性を確かめるために, 情報検索タスクに基づいた要約の評価方法を採用し, 10種類の要約作成手法による実験を行なう. 実験結果によって, 我々の手法の有効性が支持されることを示す. また, 評価実験の過程で観察された, タスクに基づく評価方法に関する問題点や留意すべき点についても分析し, 報告する.
  • 片岡 明, 増山 繁, 山本 和英
    2000 年 7 巻 4 号 p. 79-98
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    動詞を含む連体修飾表現を“N1N2”という表現に言い換える手法を提案する. 動詞を含む連体修飾節は, 各文を短縮する既存の要約手法において, 削除対象とされている. ところが, 連体修飾節の削除によって, その名詞句の指示対象を同定することが困難になる場合がある. それを表現“N1N2”に言い換えることで, 名詞句の意味を限定し, かつ, 字数を削減することが可能である. 言い換えは, 動詞を削除することによって行う. 表現“N1N2”, では, 語N1とN2の意味関係を示す述語が省略されている場合がある. この省略されうる述語を, 削除可能な動詞として2種類の方法により定義した. 一方では, 表現“N1のN2”の意味構造に対応する動詞を, シソーラスを用いて選択した. また, 他方では, ある語から連想される動詞を定義した. ただし, コーパスから, 名詞とそれが係る動詞との対を抽出し, 共起頻度の高いものを, 名詞から動詞が連想可能であると考えた. これらの削除可能な動詞を用いた言い換えを評価したところ, 再現率63.8%, 適合率61.4%との結果を得た. さらに, 言い換え可能表現の絞り込みを行うことによって適合率は82.9%に改善することが可能であることを示す.
  • 吉見 毅彦, 佐田 いち子, 福持 陽士
    2000 年 7 巻 4 号 p. 99-117
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 従来の機械翻訳システムの構文解析能力を越える倒置や挿入などを含む文に対して頑健な処理を実現するための一手法として, 形態素解析と簡単な構文解析によって得られる情報に基づいて原文を書き換える自動前編集手法を示す. 原文書き換え系を既存システムに追加することによって, 1) より品質の高い翻訳がシステムの既存部分にほとんど変更を加えることなく得られるようになるだけでなく, 2) 構文解析の負担が減少するためシステム全体としての効率化が実現できる. 実際, 提案手法を我々の英日機械翻訳システムPower E/Jに組み込み, 新聞記事を対象として実験を行なったところ, 1) 書き換え規則が適用された330文の78.8%にあたる260文の翻訳品質が改善され, 2) 書き換えを行なった場合の翻訳速度は行なわない場合の速度の1.12倍になった.
  • 石〓 友子, 片岡 明, 増山 繁, 山本 和英, 中川 聖一
    2000 年 7 巻 4 号 p. 119-142
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    字幕生成のためのニュース文要約のような報知的要約では, 原文の情報を落とさないことが望まれる. 本論文では, このような原文の情報を極力落とさない要約手法の一っとして, 重複部削除による要約手法について議論する. テキスト内に, 同一の事象を表す部分が再度出現したならば, その部分を削除することによって冗長度を減少させ, 情報欠落を可能な限り回避した要約を行う. 事象の重複を認定するために, 係り受け関係のある2語が一つの事象を表していると仮定し, 2語の係り受け関係の重複を事象の重複と認定する. また, 2語の係り受け関係を用いて重複部を削除するだけでは, 読みやすく, かつ, 自然な要約文を生成することができない. そのために考慮すべきいくつかの情報について議論する. 以上の方法のうち, 実装可能な部分を計算機上に実装し, 評価実験を行った. 人間による削除箇所と本手法による削除箇所とを比較したところ, 再現率81.0%, 適合率85.1%の結果を得た.
  • 吉見 毅彦, JIRI JELINEK, 西田 収, 田村 直之, 村上 温夫
    2000 年 7 巻 4 号 p. 143-162
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 日英機械翻訳システムTWINTRANの言語知識 (辞書と規則) と翻訳品質の評価結果について述べる. TWINTRANは次のような設計方針に基づくシステムである. 1) 翻訳対象と翻訳方向を日本語テキストから英語テキストへの翻訳に固定し, 日本語の解析知識の記述を, 日本語文法だけでなく英語文法も考慮に入れて行なう. 2) 解釈の曖昧性の解消は, 各規則に与えた優先度に基づいて解釈の候補に優劣を付け, 候補の中から最も優先度の高い解釈を選択することによって行なう. 3) 動詞の主語や目的語など日本語では任意的だが英語では義務的である情報を得るために照応解析を行なう.
    NTT機械翻訳機能試験文集を対象として行なったウィンドウテストでは, 我々の評価基準で, 試験文集の73.1%の文が合格となり, 試験文集全体の平均点も合格点を上回る結果が得られた
  • 内元 清貴, 村田 真樹, 馬 青, 関根 聡, 井佐原 均
    2000 年 7 巻 4 号 p. 163-180
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 日本語の語順の傾向をコーパスから学習する手法を提案する. ここで語順とは係り相互間の語順, つまり同じ文節に係っていく文節の順序関係を意味するものとする. 我々が提案する手法では, 文節内外に含まれるさまざまな情報から語順の傾向を自動学習するモデルを用いる. このモデルによって, それぞれの情報が語順の決定にどの程度寄与するか, また, どのような情報の組み合わせのときにどのような傾向の語順になるかを推測することができる. 個々の情報が語順の決定に寄与する度合は最大エントロピー (ME) 法によって効率良く学習される. 学習されたモデルの性能は, そのモデルを用いて語順を決めるテストを行ない, 元の文における語順とどの程度一致するかを調べることによって定量的に評価することができる. 正しい語順の情報はテキスト上に保存されているため, 学習コーパスは必ずしもタグ付きである必要はなく, 生コーパスを既存の解析システムで解析した結果を用いてもよい. 本論文ではこのことを実験によって示す.
  • 山本 和英, 隅田 英一郎
    2000 年 7 巻 4 号 p. 181-204
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    日本語は主語などの要素がしばしば省略されるため, これらの補完は対話処理において重要である. さらに音声対話処理においては, 実際に対話を処理する際に入力となるのは音声であり, 一部誤りを含んだ音声認識結果が処理対象となるため, 言語処理部においても不正確な入力に対する頑健性が要求される. このため, 入力の一部に誤りのある状況下における格要素補完問題を考え, 以前に提案した決定木を使用した補完手法を改良したモデルを提案する. このモデルは, 複数の決定木を使用することで複数解候補を出力し, その中から学習時の終端節点事例数によって解の選好を行なうことで入力誤りに対する頑健性を強化した. 音声認識の実誤りと人工的な誤りの2種類で評価実験を行なった結果, 提案手法が誤りを含む入力に対し頑健であることを確認した. また人工的な問題に対するシミュレーションの結果, 本提案手法は問題非依存であり, 入力誤りの多さに応じた決定木の組み合わせでモデルを構成することで有効に機能することが明らかとなった.
  • 石川 開, 隅田 英一郎
    2000 年 7 巻 4 号 p. 205-227
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    認識誤りに起因して, 音声翻訳の性能 (品質) が劣化するという問題がある. 認識結果の正解部分のみを翻訳する手法が提案されているが, 翻訳されない部分に関する情報は失われてしまう. 我々はこの問題を解決するため, 次のような手順からなる誤り訂正の手法を提案する.(1) 訂正の必要性の判断および誤り部分の特定を行う.(2) 認識結果の誤り近傍に関して音韻的に近い用例をテキストデータ中から検索し, 訂正候補の生成を行う.(3) 訂正候補の妥当性を意味と音韻の両方の観点から判断し, 最も妥当なものを選択する. 提案手法を音声翻訳システムに組み込み, 旅行会話を対象として評価した. 認識結果の単語誤り率で2.3%の減少, 翻訳率で5.4%の増加が得られ, 提案手法の有効性が示された.
  • 白木 伸征, 梅村 祥之, 原田 義久
    2000 年 7 巻 4 号 p. 229-246
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    近年の高度情報化の流れにより, 自動車にも種々の情報機器が搭載されるようになり, その中で音声認識・合成の必要性が高まっている. 本研究は音声合成を行うための日本語解析の中で基本となる, 文節まとめあげに関する研究報告である. 従来の文節まとめあげは, 人手規則による手法と機械学習による手法の二つに大きく分けられる. 前者は, 長年の努力により非常に高い精度を得られているが, 入力データ形式が固定であるために柔軟性に欠け, 人手で規則を作成・保守管理するため多大な労力を要し, 車載情報機器へ実装するには問題が大きい. また後者は, それらの問題に柔軟に対処できるが, 精度を向上させるためにアルゴリズムが複雑化しており, その結果開発期間が延長するなどの問題が生じ, 車載情報機器には不向きである. そこで本研究は, 決定リストを用いる手法を発展させ, 複数の決定リストを順に適用するだけという非常に簡明な文節まとめあげの手法を提案する. 決定リストの手法は非常に単純であるが, それだけでは高い精度が得られない. そこで, 決定リストを一つではなく複数作成し, それぞれのリストを最適な順序に並べて利用することにより精度向上を図った. この結果, 京大コーパスの最初の10000文を学習コーパス, 残りの約10000文をテストコーパスとして実験を行ったところ, 非常に簡明な手法ながら, 99.38%という高い精度を得られた.
  • 安達 久博
    2000 年 7 巻 4 号 p. 247-259
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    手話言語は, 主に手指動作表現により単語の表出・受容を行う視覚言語としての側面を持つ. そのため, 手話単語を構成する手指動作特徴の要素 (例えば, 手の形, 手の位置, 手の動き) の一部を変更することで別の手話単語を構成できる特徴がある. 特に, 手指動作特徴の一つの要素だけが異なる単語対を手話単語の最小対と呼ぶ. また, 手指動作特徴の類似性が意味の類似性を反映している場合がある. このように, 類似の手指動作特徴を含む手話単語対は意味関係を内包する可能性があるなど, 手話単語の分類を行うための重要な手がかりの一つとなると考える, すなわち, 類似の動作特徴を含む手話単語対は言語学的に重要であるばかりでなく, 手話単語の検索処理や登録・編集処理機能を実現する上でも重要な知識データと捉えることができる. 本論文では, 類似した手指動作特徴を含む手話単語対を与えられた手話単語の集合から抽出する方法として, 市販の手話辞典に記述されている手指動作記述文間の類似性に着目し, この手指動作記述文間の類似性を手話単語間の手指動作特徴の類似性と捉え, 手指動作記述文間の類似度計算に基づき最小対を抽出する方法を提案する. 実験により, 提案手法の妥当性を示す結果が得られた.
  • 内山 将夫, 井佐原 均
    2000 年 7 巻 4 号 p. 261-270
    発行日: 2000/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 重要文抽出によるテキスト自動要約のための各種重要度を比較した. 特に, タイトルとの類似度の高い文から抽出するという要約方法を想定し, 各種の類似度を比較した. 類似度としては, 共起関係を利用する方法と利用しない方法とを試みた. その結果, 共起関係を利用する方法の方が高精度な要約が作成できた. また, 要約の手法としては, 他に, 本文の先頭数文を抽出する方法と, 単語の重要度の総和を文の重要度とする方法も試みたが, これらの方法よりも, タイトルとの類似度に基づく方法の方が高精度であった. これらの結果は, 共起関係を利用した類似度が自動要約に有効であることを示している.
feedback
Top