自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
15 巻, 4 号
選択された号の論文の5件中1~5を表示しています
  • 林 良彦
    2008 年 15 巻 4 号 p. 1-2
    発行日: 2008/09/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 石川 徹也, 北内 啓, 城塚 音也
    2008 年 15 巻 4 号 p. 3-18
    発行日: 2008/09/10
    公開日: 2011/03/01
    ジャーナル フリー
    本研究の目的は, 歴史資料 (史料) を対象に歴史知識の構造化の基盤となる「歴史オントロジー」を構築するシステムを開発し, 広く提供することによって歴史学の発展に寄与することにある.この目標を具体的に検証するために, 昭和15年に時の帝国学士院において始められた明治前日本科学史の編纂成果である『明治前日本科学史』 (刊本全28巻) の全文を日本学士院の許諾の下に電子化し, 明治前の日本の科学技術を創成してきた科学技術者に関する属性および業績の情報を抽出することにより, 前近代日本の人物情報データベースの構築を試みる.人物の属性として人名とそれに対する役職名と地名を, 人物の業績として人名とそれに対する書名を, いずれもパターンマッチングなどのルールベースの手法によって抽出する.『明治前日本科学史総説・年表』を対象とした性能評価を行った結果, 人名, 人名とその役職名, および人名とその地名について, F値で0.8を超える結果が得られた.
  • Masato Hagiwara, Yasuhiro Ogawa, Katsuhiko Toyama
    2008 年 15 巻 4 号 p. 19-42
    発行日: 2008/09/10
    公開日: 2011/03/01
    ジャーナル フリー
    Distributional similarity is a widely adopted concept to compute lexical semantic relatedness of words.Whereas the calculation is based on the distributional hypothesis and utilizes contextual clues of words, little attention has been paid to what kind of contextual information is effective for the purpose.As one of the ways to extend contextual information, we pay attention to the use of indirect dependency, where two or more words are related via several contiguous dependency relations.We have investigated the effect of indirect dependency using automatic synonym acquisition task, and shown that the performance can be improved by using indirect dependency in addition to normal direct dependency.We have also verified its effectiveness under various experimental settings including weight functions, similarity measures, and context representations, and shown that context representations which incorporate richer syntactic information are more effective.
  • 平野 徹, 松尾 義博, 菊井 玄一郎
    2008 年 15 巻 4 号 p. 43-58
    発行日: 2008/09/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, テキストに出現する固有表現の組が意味的な関係を有するか否かを判定する手法, 特に異なる文に出現する固有表現の組に有効な手法を提案する.提案手法では, Salient Referent Listに基づく文脈的素性を新たに導入し, 単語や品詞, 係り受けなどの伝統的に利用されている素性と組合わせた.これらの素性はひとつの木構造として表現され, ブースティングに基づく分類アルゴリズムに渡される.実、験結果では, 提案手法は従来手法より精度11.3%, 再現率14.2%向上することが確認できた.
  • 実データによる形容詞オントロジーの構築にむけて
    神崎 享子, 馬 青, 山本 英子, 白土 保, 井佐原 均
    2008 年 15 巻 4 号 p. 59-88
    発行日: 2008/09/10
    公開日: 2011/03/01
    ジャーナル フリー
    本研究は, 実データに基づいた形容詞の観点からみた概念体系の自動構築をめざし, その一環として, 形容詞概念の階層関係構築に焦点を当てたものである.包含関係の尺度によって上位下位関係を求め, その単語間の上位下位関係に基づき概念階層を自動構築した.結果については, カバー率などの表層的な面と, 階層の作られ方についての質的な面での評価を行った.階層の質的な面での評価にあたって, 概念の継承関係と事例 (形容詞) の各概念の成員としての連続性という観点から心理実験を行い, 既存の人手によって作られたEDR辞書の階層と比較した.実験手法はScheffeの一対比較法を用いた.その結果, 自動構築がよい, あるいは既存の辞書と有意差がないと判断された階層は, 全体の43%となった.抽出した概念数の不足や階層構築の際の問題点など課題も抱えているが, 自動生成の階層が既存辞書の階層に対して, その結果の半分弱の階層で問題を提起するという意味で, ベースラインとなる数値と考える.
feedback
Top