自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
13 巻, 4 号
選択された号の論文の4件中1~4を表示しています
  • 斎藤 博昭
    2006 年 13 巻 4 号 p. 1-2
    発行日: 2006/10/10
    公開日: 2011/03/01
    ジャーナル フリー
  • Hideki Hirakawa
    2006 年 13 巻 4 号 p. 3-31
    発行日: 2006/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    Preference Dependency Grammar (PDG) is a framework for the morphological, syntactic and semantic analysis of natural language sentences.PDG gives packed shared data structures for encompassing the various ambiguities in each levels of sentence analysis with preference scores and a method for calculating the most plausible interpretation of a sentence.This paper proposes the Graph Branch Algorithm for computing the optimum dependency tree (the most plausible interpretation of a sentence) from a scored dependency forest which is a packed shared data structure encompassing all possible dependency trees (interpretations) of a sentence.The graph branch algorithm adopts the branch and bound principle for managing arbitrary arc co-occurrence constraints including the single valence occupation constraint which is a basic semantic constraint in PDG.This paper also reports the experiment using English texts showing the computational complexity and behavior of the graph branch algorithm.
  • 森 信介
    2006 年 13 巻 4 号 p. 33-47
    発行日: 2006/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 単語リストと生コーパスが利用可能な状況における確率的言語モデルの分野適応について述べる.このような状況の下での一般的な対処は, 単語リストを語彙に加えた自動単語分割システムによる生コーパスの自動単語分割の出力文を可能な限り人手で修正し, パラメータ推定に利用することである.しかしながら, 文単位での修正では, 正確な単語分割が容易でない箇所が含まれることになり, 作業効率の著しい低下を招く.加えて, 文単位で順に修正していくことが, 限られた作業量を割り当てる最良の方法であるかということも疑問である.本論文では, コーパスの修正を単語単位とし, 修正箇所を単語リストで与えられる適応分野に特有の単語に集中することを提案する.これにより, 上述の困難を回避し, 適応分野に特有の単語の統計的な振る舞いを捕捉するという, 適応分野のコーパスを利用する本来の目的にのみコーパス修正の作業を集中することが可能となる.実験では, 自動単語分割の結果の人手による修正の程度や方法を複数用意し, その結果得られるコーパスから推定された確率的言語モデルの予測力やそれに基づく仮名漢字変換の精度を計算した.この結果, 適応分野に特有の語彙の出現箇所に修正のコストを集中することにより, 少ない作業量で効率良く確率的言語モデルを分野適応できることが分かった.
  • 徳永 耕亮, 風間 淳一, 鳥澤 健太郎
    2006 年 13 巻 4 号 p. 49-67
    発行日: 2006/10/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 広範な概念クラスの属性語を日本語のWeb文書から獲得する手法を提案する.提案する手法は, Web検索を用いて得られた候補の単語を言語的パターン・HTMLタグ・単語の出現の統計量から計算されるスコアで順位付けする簡単な教師無しの獲得手法である.また, 本論文では, 獲得された属性語を人手で評価するための質問解答可能性に基づく評価手順を提案する.この評価手順に従い22個の概念クラスに関して提案獲得手法を人手で評価し, 提案手法により属性語を高精度で獲得可能であること, また, スコアに用いた各手がかりが実際に性能に貢献していることを確認した.
feedback
Top