自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
15 巻, 3 号
選択された号の論文の7件中1~7を表示しています
  • 荻野 綱男
    2008 年 15 巻 3 号 p. 1-2
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 木浪 孝治, 池田 哲夫, 村田 嘉利, 高山 毅, 武田 利明
    2008 年 15 巻 3 号 p. 3-20
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    今日, 大学は産学連携の一層の活性化が求められており, これを可能にするためには大学側のシーズを簡単に検索できるシステムが望まれる.そこで著者らは, 産学連携の専門家が研究のシーズを専門用語によって簡単に検索することができるシステムの構築を狙いとし, その第一段階として専門用語抽出の研究を行っている.本研究ではこれまで研究されていない看護学分野を対象分野とした.予備研究によって, 病気の症状や治療法を表す専門用語が情報検索分野における代表的な専門用語の抽出方法では抽出が難しいことが判明した.そこで, 専門用語になりうる品詞の組合せの拡張と一般的な語を除去することで専門用語抽出の性能改善を図った.その結果, 品詞の組合せを拡張することで再現率は83%から99%と専門用語をほぼもれなく抽出可能となった.更に, 単語親密度に関する研究成果を活用することで適合率は42%から55%となり大幅に向上した.
  • 山本 和英, 齋藤 真実
    2008 年 15 巻 3 号 p. 21-51
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    文間の接続関係を同定することは談話解析や複数文書要約, 質問応答など多くの分野において重要である.本論文では連続する2文に対して文間の接続関係を同定する手法を提案する.提案手法は, 入力文から抽出した構文情報や単語情報を用いて, 大量のテキストデータの中から入力の連続2文に最も近い2文を検索し, この接続関係によって入力文の文間接続関係を推定する用例利用型 (example-based) の手法によって行う.手法は, クラスタリングによって同じ接続関係を持ちやすい単語のクラスタを生成する.この結果生成された単語クラスタを用いて単語の汎化を行い, 必ずしも同じ単語が使われていなくとも接続関係の観点から類似した用例をテキスト中から探す.最後に, この用例の接続関係をもって入力文の接続関係とする.以上の手法によって入力文の文体や語の難易度によらない汎用的な同定手法を実現することが可能となった.評価実験では人手による評価で75%の正解率が得られ, 提案手法の有効性を確認した.
  • 加藤 恒昭, 福本 淳一, 桝井 文人, 神門 典子
    2008 年 15 巻 3 号 p. 53-75
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    あるトピックに関して対話的に行われる一連の情報アクセスを質問応答システムが支援する能力, 情報アクセス対話の対話相手として情報を提供するために質問応答システムが持つべき能力を定量的に評価するためのタスクを提案する.このタスクでは, 対話の実現の基本となる対話文脈を考慮した質問の解釈, つまり照応解消や省略処理等のいわゆる文脈処理の能力を評価する.本稿では, タスクの設計を示し, その根拠となる調査結果を報告する.提案するタスクは以下の点で新規かつ有益である.対話的情報アクセスを対象として, そこで必要な質問応答技術が効果的に評価できるという課題設定と構成の独自性を持つ.評価尺度については応答の自然性において問題となる回答の質や回答列挙の体系の違いに配慮し, 複数の体系を許す多段階評価手法を備えている.システムの文脈処理能力をある程度まで切り離して評価することを可能とする参照用テストセットと呼ぶ枠組みを有している.
  • 鍜治 伸裕, 喜連川 優
    2008 年 15 巻 3 号 p. 77-90
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では大規模なHTML文書集合から評価文を自動収集する手法を提案する.基本的なアイデアは「定型文」「箇条書き」「表」といった記述形式を利用するというものである.本手法に必要なのは少数の規則だけであるため, 人手をほとんどかけずに評価文を収集することが可能である.また, 任意のHTML文書に適用できる手法であるため, 様々なドメインの評価文を収集できることが期待される.実験では, 提案手法を約10億件のHTML文書に適用したところ, 約65万の評価文を獲得することができた.
  • 後藤 和人, 土屋 誠司, 渡部 広一, 河岡 司
    2008 年 15 巻 3 号 p. 91-113
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    日常的な会話の中では, 新語や固有名詞などシソーラスに定義されていない単語 (未知語) が使用される.未知語についての知識がなければ, 適切に会話を行うことができない.Webを利用することで, 未知語について調べることができる.しかし, Webには膨大な情報が存在するため, 必要な情報を効率的に得ることは困難である.未知語に対する適切なシソーラスのノードを提示することによって, 未知語の意味を獲得することができる.未知語理解はコーパスなど言語データに依存する研究が多く, 対応できない未知語が存在するという問題点がある.本論文では, 連想メカニズムを構成する概念ベースと関連度計算, さらにWebを用いて, 未知語を概念化することで各ノードとの関連性を評価し, 固有名詞を含んだ未知語をシソーラス上の最適なノードへ分類する手法を提案する.
  • 山本 和英, 牧野 恵
    2008 年 15 巻 3 号 p. 115-158
    発行日: 2008/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    現在, 文書の要約をユーザへ提示することで支援を行う自動要約の研究が盛んに行われている.既存研究の多くは語や文に対して重要度を計算し, その重要度に基づいて要約を行うものである.しかし我々人間が要約を行うときには文法などの知識やどのように要約を行ったら良いのかという様々な経験を用いているため, 我々は人間が要約に必要だと考える語や文と相関のあるような重要度の設定は難しいと考える.さらに人間が要約を行う際は様々な文の語や文節など織り交ぜて要約を作成するため, 文圧縮や文抽出の既存研究ではこのような人間が作成する要約文は作ることができない.そこで本論文ではこれらの問題点を解決し, 人間が作成するような要約を得るため用例利用型の要約手法を提案した.この要約手法の基本的なアイデアは人間が作成した要約文 (用例) を模倣して文書を要約することである.提案手法は類似用例文の獲得, 文節の対応付け, そして文節の組合せの3つの過程から構成される.評価実験では従来法の一つを比較手法として挙げ, 自動評価と人手による評価を行った.人手の評価では要約文が読みやすいかという可読性の評価と要約の内容として適切であるかという内容適切性の評価を行った.実験結果では自動評価及び人手による評価共に従来法に比べ, 本手法の方が有効であることが確認できた.また本研究で目的としていた複数文の情報を含んだ要約文が作成されたことも確認できた.
feedback
Top