自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
16 巻, 3 号
選択された号の論文の5件中1~5を表示しています
巻頭言
論文
  • 隅田 飛鳥, 吉永 直樹, 鳥澤 健太郎
    2009 年 16 巻 3 号 p. 3_3-3_24
    発行日: 2009年
    公開日: 2011/09/01
    ジャーナル フリー
    本稿では,Wikipedia の記事構造を知識源として,高精度で大量の上位下位関係を自動獲得する手法について述べる.上位下位関係は情報検索や Web ディレクトリなど,膨大な Web 文書へのアクセスを容易にする様々な技術への応用が期待されており,これまでにも様々な上位下位関係の抽出手法が開発されてきた.本稿では,Wikipedia の記事構造に含まれる節や箇条書きの見出しから,大量の上位下位関係候補を抽出し,機械学習を用いてフィルタリングすることで高精度の上位下位関係を獲得する手法を開発した.実験では,2007 年 3 月の日本語版 Wikipedia 2.2 GB から,約 77 万語を含む約 135 万対の上位下位関係を精度 90% で獲得することができた.
  • 藤江 悠五, 渡部 広一, 河岡 司
    2009 年 16 巻 3 号 p. 3_25-3_49
    発行日: 2009年
    公開日: 2011/09/01
    ジャーナル フリー
    近年,コンピュータとネットワークの発達に伴って,個人が扱える情報は膨大なものとなり,その膨大な情報の中から必要な情報を探し出すのは非常に困難となっている.既存の検索システムは基本的には表記のみを活用するため,意味的には同じ内容の検索でもユーザが入力する語によって検索結果が異なってしまう.そのためユーザが適切なキーワードを考えなければならない.そこで本稿では文書の意味を捉えた検索を実現するために単語の関連性にもとづいた文書間の類似性の定量化手法を提案する.具体的には概念ベースを用い単語間の関連性を求め,Earth Mover’s Distance により文書間の類似度を計算する方法を提案する.また概念ベースに存在しない固有名詞や新語に対して,Web 情報をもとに新概念として意味を定義し,概念ベースを自動的に拡張する方法を提案する.これら提案手法を NTCIR3-WEB によって他の手法と比較実験したところ,本手法が他手法に比べ良好な結果が得られた.
  • 大熊 智子, 梅基 宏, 三浦 康秀, 増市 博
    2009 年 16 巻 3 号 p. 3_51-3_80
    発行日: 2009年
    公開日: 2011/09/01
    ジャーナル フリー
    事物の数量的側面を表現するとき,数詞の後に連接する語を一般に助数詞と呼ぶ.英語などでは名詞に直接数詞が係って名詞の数が表現されるが,日本語では数詞だけでなく助数詞も併せて用いなければならない.名詞と助数詞の関係を正しく解析するためには,助数詞が本来持つ語彙としての性質と構文中に現れる際の文法的な性質について考慮する必要がある.本稿では,数詞と助数詞の構文を解析するための Lexical-Functional Grammar (LFG) の語彙規則と文法規則を提案し,その規則の妥当性と解析能力について検証した.提案した規則によって導出される解析結果 (f-structure) と英語,中国語の f-structure をそれぞれ比較することによって,日本語内での整合性と多言語間との整合性を有していることが確認できた.また,精度評価実験の結果,従来の LFG 規則に比べて通貨・単位に関する表現では 25%,数量に関する表現では 5%,順序に関する表現では 21% の F 値の向上が認められた.
  • 野呂 智哉, 田中 穂積, 橋本 泰一, 白井 清昭
    2009 年 16 巻 3 号 p. 3_81-3_101
    発行日: 2009年
    公開日: 2011/09/01
    ジャーナル フリー
    LR 構文解析表(LR 表)を作成する際,CFG 規則による制約だけでなく品詞(終端記号)間の接続制約も同時に組み込むことによって,LR 表中の不要な動作(アクション)を削除することができる.それにより,接続制約に違反する解析結果を受理しない LR 表を作成できるだけでなく,LR 表のサイズを縮小することも可能であり,構文解析の効率の向上が期待できる.これまでにも接続制約の組み込み手法はいくつか提案されているが,従来手法では,注目する動作の前後に実行され得る動作を局所的に考慮するため,削除しきれない動作が存在する.そこで,本論文では新しい組み込み手法を提案する.提案手法では,初期状態から最終状態までの全体の実行すべき動作列(アクションチェイン)を考慮し,接続制約を組み込む.評価実験の結果,従来手法と比較して,不要な動作をさらに約 1.2% 削減でき,構文解析所要時間は約 2.4% 短縮できることが分かった.最後に,提案手法の完全性について考察する.
feedback
Top