自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
7 巻, 1 号
選択された号の論文の5件中1~5を表示しています
  • 橋田 浩一
    2000 年 7 巻 1 号 p. 1-2
    発行日: 2000/01/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 土井 晃一
    2000 年 7 巻 1 号 p. 3-12
    発行日: 2000/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    ソフトウエアの要求獲得会議では会議参加者の関心のあることをきちんと堀起こすことが重要である. 関心のあることを堀起こすためには会議参加者の無意識の部分を知る方法が考えられる. 無意識の兆候としては古来から言い直しが挙げられている. 言い直しを利用するとしても, 言い直しを解釈するやり方は高度の技術を要する. そこで本研究では, 言い直しを解釈しないで利用する方法を考えることにする. そこでまず, 言い直した語と言い直された語との間でどちらに関心が高いかを調べた. その結果, 言い直された語の中にも話し手の関心が高いものが見受けられた. そこで, 言い直された語を抽出して, 次の会議の話題展開に用いる方法論を考案した.
  • 張 玉潔, 尾関 和彦
    2000 年 7 巻 1 号 p. 13-30
    発行日: 2000/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    多数の接続節を含む日本語長文をそのまま係り受け解析することは大変困難であることが知られている. そのため, 係り受け解析の補助手段として, 文をより単純で短い文に分割することが研究されている. 従来の方法は, 分割パターンや分割規則を人手で作成しなければならないという問題がある. 本論文では, 決定木を用いて, 分割点を推定するためのパターンをコーパスから自動的に獲得する方法を提案する. この方法によれば, 学習データ中に現われる言語現象とその出現頻度に応じて, 最適分割パターンとその適用順序が自動的に決定される. EDRコーパスを用いて, 分割パターンの自動抽出と, それを用いた分割点推定の実験を行なった. 400文の評価データに対し, 84%の適合率と再現率, また77%の文正解率が得られた. さらに, 決定木を生成する過程で枝苅りを行うことにより, 決定木の分割精度を保ちながら, その節点数を大きく削減できることが確かめられた.
  • 村田 真樹, 内元 清貴, 馬 青, 井佐原 均
    2000 年 7 巻 1 号 p. 31-50
    発行日: 2000/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    言語処理の研究には名詞句の指示性の推定という問題がある. 名詞句の指示性とは, 名詞句の対象への指示の仕方のことで, 指示性としては総称名詞句, 定名詞句, 不定名詞句の三種類が主に設けられている. この指示性は, 日英機械翻訳の冠詞生成や同一名詞句の照応解析に役に立つ. 名詞句の指示性の先行研究では, 表層の手がかり語を利用した規則を利用して解析し, 複数の規則が競合した場合は規則により各指示性に得点を付与し合計点の最も大きい指示性を解としていた. この規則に記述している得点は人手で付与しており, 人手の介入が大きい方法となっていた. 本稿では, この人手で付与していた得点部分を機械学習の手法で自動調節することで, 人手のコストを削減することに成功したことについて記述している.
  • 意味的並べかえ手法による辞書の構築例とタグつきコーパスの作成例と情報提示システム例
    村田 真樹, 神崎 享子, 内元 清貴, 馬 青, 井佐原 均
    2000 年 7 巻 1 号 p. 51-66
    発行日: 2000/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では単語の羅列を意味でソートするといろいろなときに便利であるということについて記述する. また, この単語を意味でソートするという考え方を示すと同時に, この考え方と辞書, 階層シソーラスとの関係, さらには多観点シソーラスについても論じる. そこでは単語を複数の属性で表現するという考え方も示し, 今後の言語処理のためにその考え方に基づく辞書が必要であることについても述べている. また, 単語を意味でソートすると便利になるであろう主要な三つの例についても述べる.
feedback
Top