自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
9 巻, 2 号
選択された号の論文の6件中1~6を表示しています
  • 浦谷 則好
    2002 年 9 巻 2 号 p. 1-2
    発行日: 2002/04/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 原田 実, 鈴木 亮, 南 旭瑞
    2002 年 9 巻 2 号 p. 3-22
    発行日: 2002/04/10
    公開日: 2011/03/01
    ジャーナル フリー
    意味解析を用いた情報検索の一手法を提案し, 「判例」を検索対象とし日本語文章で記述した「問い合わせ文」 を検索質問とした検索システムJCareを開発する. 本研究では'文章が表す内容を, 語が格納されたノードと語間の関係 (深層格) を表すアークからなる意味グラフとして捉え, 判例文と問い合わせ文の意味グラフ間における位相同型部分の大きさをもとに, 文章間の内容類似度を算出する. このとき検索の高速化・精度向上の目的でViewという考え方を導入する. 視点 (View) により意味グラフを分割したViewグラフの類似度を求めることで, 内容的に関連性の低い文章問の計算時間, またそこから生まれるノイズを排除する.
  • 向仲 景
    2002 年 9 巻 2 号 p. 23-43
    発行日: 2002/04/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文は, 動詞と主体の属性を用いて複文の連接関係の関係的意味を解析し, この関係的意味を用いて連接構造を解析するモデルについて述べる. 従来, 複文の従属節問の連接構造解析は, 接続の表現を階層的に分類し, その階層的な順序関係による方法が用いられてきた. しかし, 接続の表現には曖昧性があり, 同じ接続の表現でも意味が違うと係り方が違う. このため, 本論文では, 動詞と主体の属性を用いて, 連接関係の意味を求め, この連接関係の関係的意味を, 連接関係の距離によって分類する. この分類を用いて連接構造を解析する方法を用いた. 動詞の属性として, 意志性, アスペクト・ムード・ヴォイス, 意味分類などを用いた. 主体の属性として, 主節と従属節の主体が同一かどうか, 無生物主体かどうかを採用した. このモデルを実際の用例により評価した結果98.4%の精度が得られた. 接続の表現の階層的分類を使用したモデルに同じ用例を適用したところ97.0%の精度が得られたので, 本論文のモデルを使用することにより誤り率が約半分に改善された.
  • 山本 英子, 梅村 恭司
    2002 年 9 巻 2 号 p. 45-75
    発行日: 2002/04/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, コーパスから事象間の一対多関係を推定する問題を考える. これまでにコーパスから事象間の関係を推定することが多く研究されている. 一般に, この問題に対する解決法の多くは, コーパスを構成する文書における事象の共起に基づき, 暗黙的に事象間の関係は一対一関係であることを想定している. しかし, 実際には, 事象間の関係は一対多関係である場合があり, この特徴のためにいくつかの工夫が必要である. 本論文では, コーパス中の一対多関係を推定するために補完類似度を利用することを提案する. この尺度は本来文字認識システムのために開発され, テンプレートの文字のパターンにオーバーラップしたパターンがある条件で有効であることが知られているが, これまでテキスト処理に利用されたことはなかった. この補完類似度の一対多関係を推定する能力を評価するために, 地名 (都道府県市郡名) を対象事象とした実験において, 平均相互情報量, 自己相互情報量, 非対称平均相互情報量, ∅相関係数, コサイン関数ダイス相関係数, 信頼度との性能比較を行う. 実験では, 三種類のコーパスを用いる. 一つ目は実際に地名問にある一対多関係から合成する人工的なデータ集合である. 二つ目も実際の関係から合成するが, 誤った関係を導く少量の要素も含むデータ集合である. 三つ目は現実の新聞記事コーパスから得られるデータ集合である. これらの評価実験において, 補完類似度がもっとも優れており, 補完類似度は一対多関係の推定問題に対して有効であることを示す.
  • Qujiang Peng, Haodong Wu, Teiji Furugori
    2002 年 9 巻 2 号 p. 77-89
    発行日: 2002/04/10
    公開日: 2011/03/01
    ジャーナル フリー
    This paper describes a method for word sense disambiguation using a similarity metric. In this method, we first obtain context-similarity vectors for the senses of a polysemous word using a corpus and also define the context representation for the same polysemous word appearing in text. We then calculate distributional matrix between each context-similarity vector and the context representation for the word to be disambiguated. Finally, comparing the values of distributional matrices, we select the sense with the highest value as the meaning of the polysemous word. An experiment with 682 instances for 10 polysemous words shows that we are able to disambiguate at a rate of almost 92%.
  • 便利な差分検出ツールmdiffの利用
    村田 真樹
    2002 年 9 巻 2 号 p. 91-110
    発行日: 2002/04/10
    公開日: 2011/03/01
    ジャーナル フリー
    差分検出を行なうdiffコマンドは言語処理の研究において役に立つ場面が数多く存在する. 本稿では, diffを使った言語処理研究の具体的事例として, 差分検出, 書き換え規則の獲得, データのマージ, 最適照合の例を示す. diffコマンドはUNIXで標準でついているため, これを用いることは極めて容易である. 本稿は言語処理の研究を行なう上でdiffコマンドが実用的でありかつ有用であることを示すものである.
feedback
Top