自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
7 巻, 5 号
選択された号の論文の6件中1~6を表示しています
  • 江原 暉将
    2000 年 7 巻 5 号 p. 1-2
    発行日: 2000/11/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 内元 清貴, 村田 真樹, 関根 聡, 井佐原 均
    2000 年 7 巻 5 号 p. 3-17
    発行日: 2000/11/10
    公開日: 2011/03/01
    ジャーナル フリー
    係り受け解析は日本語解析の重要な基本技術の一つとして認識されている. 依存文法に基づく日本語係り受け解析では, 文を文節に分割した後, それぞれの文節がどの文節に係りやすいかを表す係り受け行列を作成し, 一文全体が最適な係り受け関係になるようにそれぞれの係り受けを決定する. 本論文ではそのうち, 係り受け行列の各要素の値を計算するためのモデルについて述べる. アプローチとしては, 主にルールベースによる方法と統計的手法の二つのものがあるが, 我々は利用可能なコーパスが増加してきたこと, 規則の変更に伴うコストなどを考慮して, 統計的手法をとっている. 統計的手法では行列の各要素の値は確率値として計算される. これまでよく用いられていたモデル (旧モデル) では, その確率値を計算する際に, 着目している二つの文節が係るか係らないかということのみを考慮していた. 本論文では, 着目している二つの文節 (前文節と後文節) だけを考慮するのではなく, 前文節と前文節より文末側のすべての文節との関係 (後方文脈) を考慮するモデルを提案する. このモデルをME (最大エントロピー) に基づくモデルとして実装した場合, 旧モデルを同じくMEに基づくモデルとして実装した場合に比べて, 京大コーパスに対する実験で, 全く同じ素性を用いているにもかかわらず係り受け単位で1%程度高い精度 (88%) が得られた.
  • 実装に向けての精緻化・拡張
    大谷 朗, 宮田 高志, 松本 裕治
    2000 年 7 巻 5 号 p. 19-49
    発行日: 2000/11/10
    公開日: 2011/03/01
    ジャーナル フリー
    自然言語処理において, 言語の諸相を見据えた宣言的な文法にもとつく構文解析は必須である. 実用的な文法体系を構築するため, 我々は最近の主辞駆動句構造文法の成果を実装することにより, NAIST JPSGという単一化にもとついた日本語句構造文法を構築した. NAIST JPSGでは, 日本語の様々な特徴の検討を経て, それらの間の規則性を局所的な制約として記述することで, 文法の原理, スキーマおよび素性が設計されている. また, 個別言語の現象として, 格助詞の分布・サ変動詞構文の意味的局所性・連体修飾節における格を伴った修飾句の係り先について, それらの語彙情報に関心を持って我々は分析した.(i) 格助詞が現れるか否かは, 言語的対象を説明する素性体系の一部である型階層化された格素性にもとついて説明できる.(ii) サ変動詞構文は形態的には複雑な構造でありながら意味的には単純な関係を含んでいるが, そのような不整合は語彙記述および単一化といった一般的な機構によって解消される.(iii) 連体修飾に関してコーパスを調査することで, いくつかの修飾一被修飾の関係は述語的な形態素を導入することにより削減することができる.
  • 梅村 祥之, 原田 義久, 清水 司, 杉本 軍司
    2000 年 7 巻 5 号 p. 51-70
    発行日: 2000/11/10
    公開日: 2011/03/01
    ジャーナル フリー
    音声合成におけるポーズ制御において重要となる局所係り受け解析に関し, 決定リストを用いる方法を開発し, ポーズ挿入の正解率をF値で評価したところ90.04%を得た. 本係り受け解析は決定リストを用いているので, 使用するメモリの容量と処理速度に関して設定を容易に変更できるという特徴を有している. このため, 用途に応じてメモリ容量, 計算速度が選択できる. 計算速度を重視し, メモリ容量を12Kバイトと小さくした場合, 文あたりのポーズ設定処理の時間7msec (Pentium III 450MHz), F値85%となり, 音声合成システムへの実装が現実的であることがわかった. 係り受け解析結果に基づくポーズ挿入位置制御規則を作成し, 聴取実験によって性能を確認した. その結果, 係り受け距離のみに基づく制御で, 85%程度のポーズ挿入位置が挿入適当という結果であった. さらに, 句読点や, ポーズの連続などの要因を取り入れて規則の精緻化を行った結果, 91%程度のポーズ挿入位置が挿入適当という結果が得られた.
  • 金山 博, 鳥澤 健太郎, 光石 豊, 辻井 潤一
    2000 年 7 巻 5 号 p. 71-91
    発行日: 2000/11/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では、日本語係り受け解析のための統計的手法について述べる。この手法は、統計値の計算方法が従来の手法と異なる。従来の手法では、2つの文節問が依存関係にある確率をそれぞれの文節の組に対して計算するが、本研究で提案する「3つ組/4つ組モデル」は、係り元の文節と係り先の文節の候補となる全ての文節に関する情報を確率の条件部として、ある文節が係り先として選択される確率を求める。なお、係り先の候補は、HPSGに基づいた文法及びヒューリスティクスによって高々3つに絞られる。確率の推定には最大エントロピー法を用いており、我々の構文解析器は耳DRコーパスに対して文節正解率88.6%という高い解析精度を達成した。
  • 白井 清昭, 植木 正裕, 橋本 泰一, 徳永 健伸, 田中 穂積
    2000 年 7 巻 5 号 p. 93-112
    発行日: 2000/11/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 我々が現在公開している自然言語解析用ツール「MSLRパーザ・ツールキット」の特徴と機能について述べる. MSLRパーザは, 一般化LR法の解析アルゴリズムを拡張し, 日本語などの分かち書きされていない文の形態素解析と構文解析を同時に行うツールである. MSLRパーザを用いて解析を行う際には, まずLR表作成器を用いて, 文法と接続表からLR表を作成する. このとき, LR表作成器は, 接続表に記述された品詞間の接続制約を組み込んだLR表を生成する. このため, 接続制約に違反する解析結果を受理しないLR表が作られるだけでなく, LR表の大きさを大幅に縮小することができる. 次に, MSLRパーザは, 作成されたLR表と辞書を用いて辞書引きによる単語分割と構文解析を同時に行い, その結果として構文木を出力する. さらに, MSLRパーザは, 文中の括弧の組によって係り受けに関する部分的な制約が与えられた文を入力とし, その制約を満たす構文木のみを出力する機能を持つ. また, 文脈依存性を若干反映した言語モデルのひとつである確率一般化LRモデル (PGLRモデル) を学習し, 個々の構文木に対してPGLRモデルに基づく生成確率を計算し, 解析結果の優先順位付けを行う機能も持つ.
feedback
Top