自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
17 巻, 2 号
選択された号の論文の4件中1~4を表示しています
巻頭言
論文
  • 黄 海湘, 藤井 敦
    2010 年 17 巻 2 号 p. 2_3-2_24
    発行日: 2010年
    公開日: 2011/06/23
    ジャーナル フリー
    外国語を翻字するときに,日本語や韓国語ではカタカナやハングルなどの表音文字を用いるのに対して,中国語では漢字を用いる.しかし,漢字は表意文字であるため,発音が同じでも漢字によって意味や印象は異なる可能性がある.この問題を解消するために,ユーザが与えた関連語に基づいて翻字に使用する漢字を選択する手法がある.しかしユーザの負担が大きいため,本研究は,翻字対象の関連語を World Wide Web から自動的に抽出し,中国語への翻字に使用する手法を提案する.評価実験によって提案手法の有効性を示す.
  • 飯田 龍, 小町 守, 井之上 直也, 乾 健太郎, 松本 裕治
    2010 年 17 巻 2 号 p. 2_25-2_50
    発行日: 2010年
    公開日: 2011/06/23
    ジャーナル フリー
    本論文では,日本語書き言葉を対象とした述語項構造と照応関係のタグ付与について議論する.述語項構造解析や照応解析は形態素・構文解析などの基盤技術と自然言語処理の応用分野とを繋ぐ重要な技術であり,これらの解析のための主要な手法はタグ付与コーパスを用いた学習に基づく手法である.この手法を実現するためには大規模な訓練データが必要となるが,これまでに日本語を対象にした大規模なタグ付きコーパスは存在しなかった.また,既存のコーパス作成に関する研究で導入されているタグ付与の基準は,言語の違いや最終的に出力したい解析結果の粒度が異なるため,そのまま利用することができない.そこで,我々は既存のいくつかのタグ付与の仕様を吟味し,述語項構造と共参照関係のアノテーションを行うためにタグ付与の基準がどうあるべきかについて検討した.本論文ではその結果について報告する.また,京都コーパス第 3.0 版の記事を対象にタグ付与作業を行った結果とその際に問題となった点について報告する.さらにタグ付与の仕様の改善案を示し,その案にしたがい作業をやり直した結果についても報告する.
  • 永田 亮, 河合 綾子, 須田 幸次, 掛川 淳一, 森広 浩一郎
    2010 年 17 巻 2 号 p. 2_51-2_65
    発行日: 2010年
    公開日: 2011/06/23
    ジャーナル フリー
    自然言語処理や言語学においてコーパスは重要な役割を果たすが,従来のコーパスは大人の文章を集めたコーパスが中心であり,子供の文章を集めたコーパスは非常に少ない.その理由として,子供のコーパスに特有の様々な難しさが挙げられる.そこで,本論文では,子供のコーパスを構築する際に生じる難しさを整理,分類し,効率良く子供のコーパスを構築する方法を提案する.また,提案方法で実際に構築した「こどもコーパス」についても述べる.提案方法により,81人分(39,269形態素)のコーパスを構築することができ,提案方法の有効性を確認した.この規模は,公開されている日本語書き言葉子供コーパスとしては最大規模である.また,規模に加えて,「こどもコーパス」は作文履歴がトレース可能であるという特徴も有する.
feedback
Top