自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
9 巻, 1 号
選択された号の論文の7件中1~7を表示しています
  • 徳永 健伸
    2002 年 9 巻 1 号 p. 1-2
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 河原 大輔, 黒橋 禎夫
    2002 年 9 巻 1 号 p. 3-19
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 生コーパスから格フルームを自動的に構築する手法を提案する.格フルームの自動構築における最大の問題は, 用言の用法の多様性をどのように扱うかということである.本研究では, 用言と直前の格要素の組を単位としてコーパスから格要素と用言の用例を収集することにより, 用言の用法の多様性を扱う.さらに, 用法に違いはないが, 直前の単語が異なるために別の格フルームになっているもののクラスタリングを行う.得られた格フルームを用いて格解析実験を行い, その結果を考察する.
  • 安達 久博
    2002 年 9 巻 1 号 p. 21-41
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    手話は聴覚障害者と健聴者との重要なコミュニケーション手段の1つであり, 手話を学習する健聴者の数も年々増加する傾向にある. この様な背景から, 近年, 手話の学習支援システムや手話通訳システムなどの研究が各所で盛んに行われている. 特に, これらの自然言語処理システムの知識辞書となる手話電子化辞書の構築は重要な課題であり, 手話側から対応する日本語ラベルを効率良く検索する手段の実現は, 日本語と手話との対訳辞書の検索機能として, 必要不可欠な要素技術といえる. 従来の検索方法の多くは, 手話単語の手指動作特徴を検索項目とし, 検索条件を詳細に設定する必要があった. そのため, 初心者には満足する検索結果を得ることが難しいという問題点が指摘されている. この主な原因の1つは, 検索条件の複雑さや検索項目間の類似性から選択ミスが生じやすく, 結果として, 利用者の要求に適合する検索結果が出力されないという問題点にある. 本論文では, 市販の手話辞典に記載されている手指動作記述文に着目した検索方法を提案する. 本手法の特徴は, 検索キーとして入力された手指動作記述文と類似の手指動作記述文を検索辞書から検索し, 対応する手話単語の日本語ラベルを利用者に提示する点にある. すなわち, 手話単語の検索問題を文献検索問題と捉えたアプローチといえる. 実験の結果, 本手法の妥当性を示す結果が得られた. 一方, 実験により明らかになった問題点の1つとして, 手指動作記述文で表現された手指動作の一部に曖昧さがあることが分かった. この問題を含め, 本手法の問題点と今後の課題について, 例を示しながら詳細に議論する.
  • 堂坂 浩二, 安田 宜仁, 相川 清明
    2002 年 9 巻 1 号 p. 43-63
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 音声対話システムがシステム知識として保有するデータベースの内容に依存して, できるだけ短い対話でユーザの必要とする情報を伝達するためのデュアルコスト法と呼ぶ対話制御法を提案する. 音声対話システムは, 音声認識誤りのために, ユーザ要求内容を確定することを目的とした「確認対話」を実施する必要がある. 長い確認対話は対話の円滑な流れを阻害するので, 確認対話は簡潔であることが望ましい. ユーザは対話時点でのシステム知識の内容を知らないので, システムが詳しい情報を保有していない事柄に関して詳細な情報を要求する場合が頻繁に起きる. そのような場合にも, 従来法ではユーザ発話内容を逐一確認するので, 無駄な確認が増えてしまうという問題があった. この問題を解決するために, 確認コストと情報伝達コストと呼ぶ2種類のコストを導入する. 確認コストは確認対話の長さであり, 音声認識率に依存する. 情報伝達コストは, 確認対話でユーザ要求を確定した後, ユーザに情報を伝達する際のシステム応答の長さであり, システム知識の内容に依存する. デュアルコスト法は, この2つのコストの和を最小化することにより対話を制御する方法であり, 従来法が避けることができない無駄な確認対話を回避しながら, 短い対話でユーザ要求に応じた情報を伝達することができる.
  • 宇津呂 武仁, 颯々野 学, 内元 清貴
    2002 年 9 巻 1 号 p. 65-100
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 日本語固有表現抽出の問題において, 複数のモデルの出力を混合する手法を提案する. 一般に, 複数のモデル・システムの出力の混合を行なう際には, まず, できるだけ振る舞いの異なる複数のモデル・システムを用意する必要がある. 本論文では, 最大エントロピー法に基づく統計的学習による固有表現抽出モデルにおいて, 現在位置の形態素が, いくつの形態素から構成される固有表現の一部であるかを考慮して学習を行なう可変 (文脈) 長モデルと, 常に現在位置の形態素の前後数形態素ずつまでを考慮して学習を行なう固定 (文脈) 長モデルとの間のモデルの挙動の違いに注目する. そして, 複数のモデルの挙動の違いを調査し, なるべく挙動が異なり, かつ, 適度な性能を保った複数のモデルの出力の混合を行なう. 次に, 混合の方式としては, 複数のシステム・モデルの出力 (および訓練データそのもの) を入力とする第二段目の学習器を用いて, 複数のシステム・モデルの出力の混合を行なう規則を学習するという混合法 (stacking法) を採用する. 第二段目の学習器として決定リスト学習を用いて, 固定長モデルおよび可変長モデルの出力を混合する実験を行なった結果, 最大エントロピー法に基づく固有表現抽出モデルにおいてこれまで得られていた最高の性能を上回る性能が達成された.
  • 佐藤 健吾, 斎藤 博昭
    2002 年 9 巻 1 号 p. 101-115
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    機械翻訳などの多言語間自然言語処理で用いられる対訳辞書は現在, 人手によって作成されることが多い. しかし, 人手による作成には一貫性・網羅性などの点で限界があることから対訳コーパスから自動的に対訳辞書を作成しようとする研究が近年盛んに行われている. 本論文では, 最大エントロピー法を用いて対訳コーパス上に対訳関係の確率モデルを推定し, 自動的に対訳単語対を抽出する手法を提案する. 素性関数として共起情報を用いるモデルと品詞情報を用いるモデルを定義した. 共起情報により対訳関係にある単語の意味を制約し, 品詞情報により対訳関係にある単語の品詞を制約する. 本手法の有効性を示すために日英対訳コーパスを用いた対訳単語対の抽出実験を行い, 本論文で提案した手法が従来の手法よりも精度・再現率において優れた結果となり, また, テストコーパスによる実験では学習コーパスに出現しなかった単語対に関しても学習データに現れたものとほぼ同等の精度・再現率で抽出できることを示した.
  • 池原 悟, 村上 仁一, 車井 登
    2002 年 9 巻 1 号 p. 117-134
    発行日: 2002/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    日英機械翻訳において, 翻訳が難しいと見られる抽象名詞, 「の」, 「こと」, 「もの」・「ところ」, 「とき」, 「わけ」の6種類を対象に, 文法的用法と意味的用法を分類し, 英語表現との対応関係を検討した.具体的には, 名詞「の」は, 意味的に他の抽象名詞に置き換えられる場合 (交替現象) の多いことに着目して, 置き換え先となる抽象名詞の種類と置き換え可能となる条件について検討した.次に, 置き換え後の5種類の抽象名詞の用法を「語彙的意味の用法」, 「文法的意味の用法」に分け, このうち, 「文法的意味の用法」を, さらに, 「補助動詞的用法」と「非補助動詞的用法」に分類した.さらに, これらの分類を詳細化し, 英語表現との対応関係を「日英対応表」にまとめた.交替現象の解析精度と「日英対応表」の精度を調べるため, 新聞記事から抽出した抽象名詞の用例に適用した結果では, 「の」の交替現象の解析精度は, 97%, 「日英対応表」の平均カバー率は89%, 平均正解率は73%であった.
feedback
Top