自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
2 巻, 1 号
選択された号の論文の5件中1~5を表示しています
  • 田中 穂積
    1995 年 2 巻 1 号 p. 1-2
    発行日: 1995/01/10
    公開日: 2011/03/01
    ジャーナル フリー
  • 池原 悟, 白井 諭, 横尾 昭男, FRANCIS BOND, 小見 佳恵
    1995 年 2 巻 1 号 p. 3-17
    発行日: 1995/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    機械翻訳システムを使用して現実の文書を翻訳する場合, 通常, 翻訳対象文書に合った利用者辞書が必要となる. 特に, 高品質翻訳を狙った機械翻訳システムでは, 各単語に対して, 約2,000種以上の分解精度を持つ単語意味属性の付与が必要であると言われており, 一般の利用者が, このような精密な情報を付与するのは困難であった. そこで本論文では, 利用者が登録したい日本語名詞 (複合名詞を含む) と英語訳語を与えるだけで, システムがシステム辞書の知識を応用して, 名詞種別を自動的に判定し, それに応じた単語の意味属性を付与する方法を提案する. 本方式を, 新聞記事102文とソフトウエア設計書105文の翻訳に必要な利用者辞書作成に適用した結果, 自動推定方式では, 専門家の付与した意味属性よりも多くの属性が付与されるが, 40~80%の再現率が得られることが分かった. また, 人手で作成した利用者辞書を使用する場合と同等の訳文品質が得られることが分かった. 以上の結果, 利用者辞書作成への単語の登録において, 最も熟練度の要求される単語意味属性付与作業を自動化できる見通しとなった.
  • 「ので」「のに」による接続を中心として
    西沢 信一郎, 中川 裕志
    1995 年 2 巻 1 号 p. 19-38
    発行日: 1995/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    我々は, 接続助詞「ので」による順接の複文と接続助詞「のに」による逆接の複文を対象とする理解システムを計算機上に構築することを目的とする. この際には, ゼロ代名詞の照応の解析が重要な問題となるが, 文献 (中川1994; Nakagawa and Nishizawa 1994) にあるように, 本論文で扱う形式の複文では動機保持者という語用論的役割を新たに定義し用いることにより, 従属節と主節それぞれで設定される意味役割や語用論的役割の間の関係を制約として記述することができる. そこで, 日本語の複文に対する形態素解析や構文解析の結果を素性構造で記述し, この結果に対して制約論理プログラミングの手法を用いることにより意味および語用論的役割間の制約を解消し, ゼロ代名詞照応などを分析する理解システムを計算機上に構築した.
  • 山本 和英, 増山 繁, 内藤 昭三
    1995 年 2 巻 1 号 p. 39-55
    発行日: 1995/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    日本語文章要約システムGREENについて報告する. 一般に, 質の良い文章要約を行うためには, ある一つの言語現象だけをとらえた談話解析だけでは不十分である. なぜなら, 談話に関わる言語現象は相互に関連しているからである. 本研究ではこの観点から, 日本語での様々な表層的特徴をできるだけ多く利用して, 日本語文章の要約を試みる. 本稿では実際に計算機上で試作した論説文要約システムGREENに関して, これで用いられている論説文要約の手法の紹介と, これによって出力された文章の評価を行う.
  • 金 明哲
    1995 年 2 巻 1 号 p. 57-75
    発行日: 1995/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    文章 (テキスト) の執筆者の推定問題などに対して, 文章の内容や成立に関する歴史的事実の考証とは別に, 文章から著者の文体の計量的な特徴を抽出し, その統計分析によって問題解決を試みる研究が多くの人々の注目をあつめつつある. 文章に関するどのような要素に著者の特徴が現れるかについて, 欧米文に関してはいくつかの研究の例があるが, それは言語によって異なるとも考えられるため, 欧米文に関する研究成果が日本文の場合にもあてはまるかについて実証的な研究が必要である. また, 各言語はその言語における著者の特徴を表す独特な要素があることも考えられる. 本論文では, 今まで明らかにされていない, 日本文における動詞の長さの分布に著者の特徴が現れることと, その結果が動詞中の漢語・和語, 合成語・非合成語の使用率の影響ではないことを著者3人の計21の文章を用いて明らかにした. 計量分析の手法としては, 同一著者の文章における動詞の長さの分布問の距離の平均値と, 異なる著者の文章における動詞の長さの分布の距離の平均値との差, および距離マトリックスを用いて主成分分析を行うという方法を用いて数量・視覚的文章の分類を試みた.
feedback
Top