自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
11 巻, 1 号
選択された号の論文の6件中1~6を表示しています
  • 青江 順一
    2004 年 11 巻 1 号 p. 1-2
    発行日: 2004/01/10
    公開日: 2011/03/01
    ジャーナル フリー
  • Mohammad Teduh Uliniansyah, Shun Ishizaki, Kiyoko Uchiyama
    2004 年 11 巻 1 号 p. 3-20
    発行日: 2004/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    The Indonesian language (Bahasa Indonesia) has a number of uncommon characteristics, such as a great amount of derivational affixes. There are so many combinations of affixes and stems in Bahasa Indonesia that ambiguities often arise. To record all words into a word dictionary is almost impossible because it will make the size of the word dictionary huge and processing time very long. We propose a method to analyze the morphology of Indonesian words by using part-of-speech (POS) tagged data, an affix rule table and minimum connectivity costs to solve the problems mentioned above. Experiments showed that our system achieved a good analysis result (more than 97% accuracy).
  • 中嶋 健一郎, 斎藤 憲, 東条 敏
    2004 年 11 巻 1 号 p. 21-41
    発行日: 2004/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    本研究では古典ギリシア語で書かれたユークリッドの『原論』を主辞駆動型句構造文法 (HPSG) により構文解析することを目的とする. 単一化をベースにした文法を用いる理由は, 古典ギリシア語が語順よりも性・数・格の素性の一致によってより強く文構造が決定されるためである. 文法を記述するにあたっては他の言語と同様な基本的な文法規則に加えて, 古典ギリシア語特有の文法規則, すなわち素性の一致によって推測される省略語や係り受け交差に対処する規則を追加した. 構文解析システムはLiLFeSを用い, それにより, ユークリッドの『原論』7巻・8巻1154文に対して約79%のカヴァレッジを得ることができた.
  • 謝 軍, 今井 啓允, 池田 尚志
    2004 年 11 巻 1 号 p. 43-80
    発行日: 2004/01/10
    公開日: 2011/06/07
    ジャーナル フリー
    本稿では, 我々が開発している日中機械翻訳システムjaw/Chineseにおける変換・生成の方式について述べる.jaw/Chineseの翻訳は, 表現パターンの変換による命題的内容の翻訳とモダリティ等の翻訳による用言後接機能語の翻訳の2つの処理段階から成っている. 命題的内容の翻訳では, 構文解析→パターン照合変換→訳語生成の順で行なう. 命題的内容の翻訳規則に関しては基本型, 内容語追加型, 機能語追加型3種のパターン変換規則を設けて, 対応する中国語の訳語, 意味格の格名や格標識などで記述する・用言後接機瀧語を機瀧によって「使役等」, 「時制等」, 「判断等」, 「接続」の4つの要素に整理し, 「使役等」, 「時制等」, 「判断等」と対応する中国語の補助的表現要素を分析してその翻訳規則を表の形式で考案した.「接続」については, 機能語追加型表現パターンの翻訳規則を記述し, 命題的内容の翻訳と同一視して翻訳を行なう. また, 中国語の意味格および補助的表現要素の並び順序である文型について考察し, 訳文の語順生成に用いる. 最後にC++の上に実装したこのパイロットシステムの方式の有効性を示す.
  • 鍜治 伸裕, 黒橋 禎夫
    2004 年 11 巻 1 号 p. 81-106
    発行日: 2004/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    言い換え処理は, 様々な自然言語処理アプリケーションで必要とされている非常に重要な技術である. 言い換え処理の一つとして, 本論文では「名詞+格助詞+動詞」という形の迂言表現と重複表現を国語辞典を用いて認識し, さらにそれらを言い換える手法を提案する. 迂言表現とは, 動詞が動作を表していない表現や, 名詞が動作の主体や対象を表わさずに動作の状態を表している表現のことである. そして重複表現とは, 動詞と名詞の問に意味の重複がある表現のことである. これらの表現には, 多くの場合, 同じ意味をより簡潔な形であらわした表現が存在する. 提案手法の認識処理と言い換え処理の精度を二人の被験者が判断したところ, 認識処理の精度は, 平均して適合率78%, 再現率52%であった. また, 言い換え処理の精度は平均して91%であった.
  • 荒牧 英治, 黒橋 禎夫, 柏岡 秀紀, 田中 英輝
    2004 年 11 巻 1 号 p. 107-123
    発行日: 2004/01/10
    公開日: 2011/03/01
    ジャーナル フリー
    本稿では, 内容レベルで対応のとれている対訳記事コーパスを用いて, 用例ベース翻訳を実現する手法を提案する. まず, 対訳コーパスの文・句アライメントを行い, 確信度の高いものを抽出し, 翻訳用例データベースに登録する. 次に, 与えられた入力文と類似しており, かつ, アライメント確信度の高い翻訳用例をデータベースから選択し, 翻訳文を生成する. 訳語選択という観点からおこなった実験は82%の精度であり, 用例ベース翻訳が可能であることを実証的に示す.
feedback
Top