自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
4 巻, 3 号
選択された号の論文の6件中1~6を表示しています
  • 片桐 恭弘
    1997 年 4 巻 3 号 p. 1-2
    発行日: 1997/07/10
    公開日: 2011/03/01
    ジャーナル フリー
  • the right place to choose between translation equivalents
    John D. Phillips
    1997 年 4 巻 3 号 p. 3-25
    発行日: 1997/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    This paper looks at the problem of choosing between alternative lexical translationequivalents in machine translation. It argues that the knowledge base used for makingchoices between alternative translations is part of the target language grammarand that it should be applied and the translation chosen as part of generation of thetarget language text. This contrasts with previous work on the problem, which hasassumed that these choices should be made in analysis or transfer. Various types ofknowledge base could be used to make the choice between alternatives. The methodoutlined here uses information about stereotypical contexts of use of words, storedas part of an ontological network.
  • 内山 将夫, 板橋 秀一
    1997 年 4 巻 3 号 p. 27-50
    発行日: 1997/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 語義の尤度パラメータの標本空間を, シソーラスに沿って動的に拡張することにより, 動詞の多義性を解消する手法を提案する.提案手法では, 尤度1位の語義と2位の語義とを比較し, 尤度差が統計的に有意ならば, 1位の語義を選ぶ.有意でなければ, シソーラスに沿って標本空間を一段拡張し, 多義性解消を試みる.もし, 最大の標本空間でも尤度差が有意でなければ, 語義は判定しない.本稿の実験では, EDR日本語コーパスから頻度500以上の動詞74語を抽出し, 延べで約89,000の動詞について多義性を解消した.このとき, 最頻の語義を常に選ぶ場合の適合率は0.65, 判定率は1.00であった.ただし, 判定率とは, 多義性の解消を試みたなかで, 実際に語義が判定された割合である.クラスベースの手法と提案手法とを比較すると, 分類語彙表を利用した場合には, 適合率は共に0.71であったが, 判定率は, クラスベースの手法が0.68, 提案手法が0.73であった.EDR概念体系を利用した場合には, 適合率は共に0.70であったが, 判定率は, クラスベースの手法が0.76, 提案手法が0.87であった.両者の判定率を比べると, 提案手法の方が統計的に有意に高く, その有効性が示された.
  • 大井 耕三, 隅田 英一郎, 飯田 仁
    1997 年 4 巻 3 号 p. 51-70
    発行日: 1997/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    単語間の意味的類似性に基づく検索 (以下, 類似検索と呼ぶ) は文書検索技術において, 重要な課題の一つである.類似性に関する従来研究では, 階層構造が平衡しているシソーラスを使った単語間の類似度が提案され, 言語翻訳, 文書検索などの応用における有効性が示されている.本論文では, 階層構造が平衡していないシソーラスにも適用できる, より一般的な単語間の意味的類似度を提案する.本提案では各単語が担う概念間の最下位共通上位概念が有する下位概念の総数が少ないほど, 単語間の類似度が大きくなる.筆者らは, この意味的類似度と大規模シソーラスの一つであるEDRシソーラスを使って, 類似検索システムを実装した.さらに, 精度を向上させるために, 単語の多義解消手法をこの検索システムに導入した.本類似検索システムは, 単語間の物理的近さと単語の重要度を用いた拡張論理型の従来システムに基づいている.この従来システムとの比較実験を行ない, 意味的類似性と多義解消を用いた提案の類似検索手法によって再現率・適合率が向上したことを確認した.
  • 北 研二
    1997 年 4 巻 3 号 p. 71-82
    発行日: 1997/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 言語のクラスタリングに関する新しい手法を提案する.提案する手法では, まず各言語の言語データから確率的言語モデルを構築し, 次に確率的言語モデルの間に導入した距離に基づき, 元の言語に対するクラスタリングを実行する.本論文では, 以上の手法をN-gramモデルの場合について詳しく述べている.また, 提案した手法を用いて, ECI多言語コーパス (European Corpus Initiative Multilingual Corpus) 中の19ヶ国語のテキスト・データから, 言語の系統樹を再構築する実験を行った.本実験で得られた結果は, 言語学で確立された言語系統樹と非常に似ており, 提案した手法の有効性を示すことができた.
  • 奥 雅博, 松岡 浩司
    1997 年 4 巻 3 号 p. 83-99
    発行日: 1997/07/10
    公開日: 2011/03/01
    ジャーナル フリー
    本論文では, 文字連鎖を用いた複合語同音異義語誤りの検出手法とその評価について述べる.ワードプロセッサによって作成された日本語文書には, 変換誤りに起因する同音異義語誤りが生じやすい.同音異義語誤りは, 同じ読みの単語を誤った単語へと変換してしまう誤りである.このため, 推敲支援システムにおいて同音異義語誤りを検出する機能を実現することは重要な課題の1つとなっている.我々は, 意味的制約に基づく複合語同音異義語誤りの検出/訂正支援手法を提案した.しかし, この手法においてもいくつかの短所が存在する.本論文では, これらの短所を補うための手法として, 文字連鎖を誤り検出知識として用いた複合語同音異義語誤りの検出手法について述べる.文字連鎖は, 既存の文書を解析することなしに容易に収集することができる.また, 本手法は文字連鎖のみを用いているので, 複合語同音異義語誤りに限らず, 文字削除誤りなどの別のタイプの誤りに適用することも可能である.さらに本論文では, 本手法の有効性を検証するために行った評価実験の結果についても述べ, 意味的制約を用いた複合語同音異義語誤り検出/訂正支援手法との比較についても述べる.
feedback
Top