自然言語処理

巻頭言

20周年記念年次大会発表論文集

加藤恒昭

2014 年 21 巻 5 号 p. 979
発行日: 2014/09/16
公開日: 2014/12/16

DOIhttps://doi.org/10.5715/jnlp.21.979

ジャーナルフリー

PDF形式でダウンロード (96K)

論文

A Generative Dependency N-gram Language Model: Unsupervised Parameter Estimation and Application

Chenchen Ding, Mikio Yamamoto

2014 年 21 巻 5 号 p. 981-1009
発行日: 2014/09/16
公開日: 2014/12/16

DOIhttps://doi.org/10.5715/jnlp.21.981

ジャーナルフリー

抄録を表示する抄録を非表示にする

We design a language model based on a generative dependency structure for sentences. The parameter of the model is the probability of a dependency N-gram, which is composed of lexical words with four types of extra tag used to model the dependency relation and valence. We further propose an unsupervised expectation-maximization algorithm for parameter estimation, in which all possible dependency structures of a sentence are considered. As the algorithm is language-independent, it can be used on a raw corpus from any language, without any part-of-speech annotation, tree-bank or trained parser. We conducted experiments using four languages, i.e., English, German, Spanish and Japanese, to illustrate the applicability and the properties of the proposed approach. We further apply the proposed approach to a Chinese microblog data set to extract and investigate Internet-based, non-standard lexical dependency features of user-generated content.

抄録全体を表示

PDF形式でダウンロード (659K)
共変量シフト下の学習による語義曖昧性解消の教師なし領域適応

新納浩幸, 佐々木稔

2014 年 21 巻 5 号 p. 1011-1035
発行日: 2014/09/16
公開日: 2014/12/16

DOIhttps://doi.org/10.5715/jnlp.21.1011

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文では語義曖昧性解消(Word Sense Disambiguation，WSD)の教師なし領域適応の問題に対して，共変量シフト下の学習を試みる．共変量シフト下の学習では確率密度比 w(x) = P_T(x)/P_S(x) を重みとした重み付き学習を行うが，WSD の場合，推定される確率密度比の値が小さくなる傾向がある．ここでは P_T(x) と P_S(x) をそれぞれ求めて，その比を取ることで w(x) を推定するが，P_S(x) を求める際に，ターゲット領域のコーパスとソース領域のコーパスを合わせたコーパスを，新たにソース領域のコーパス S と見なすことで，先の問題に対処する．BCCWJ の 3 つの領域 OC （Yahoo! 知恵袋），PB（書籍）及び PN（新聞）を選び，SemEval-2 の日本語 WSD タスクのデータを利用して，多義語 16 種類を対象に，WSD の領域適応の実験を行った．w(x) を推定する手法として，P_T(x) と P_S(x) を求めずに，w(x) を直接推定する uLSIF も試みた．また確率密度比を上方修正するために「p 乗する」「相対確率密度比を取る」という手法も組み合わせて試みた．それらの実験の結果，提案手法の有効性が示された．

抄録全体を表示

PDF形式でダウンロード (544K)
単語並べ替えと冠詞生成の同時逐次処理：日英機械翻訳への適用

林克彦, 須藤克仁, 塚田元, 鈴木潤, 永田昌明

2014 年 21 巻 5 号 p. 1037-1057
発行日: 2014/09/16
公開日: 2014/12/16

DOIhttps://doi.org/10.5715/jnlp.21.1037

ジャーナルフリー

抄録を表示する抄録を非表示にする

本稿では，機械翻訳の単語並べ替え問題にシフトリデュース構文解析法を応用するための手法を提案する．提案手法では，単一言語の Inversion Transduction 文法によって単語並べ替え問題を定式化する．また，日本語文と英語文との単語対応をとりやすくするため，あらかじめ除去した英冠詞を翻訳結果へ挿入する問題も単語並べ替えと同時に定式化する．提案法を日英特許翻訳に適用したところ，句に基づく統計的機械翻訳の BLEU スコア 29.99 に対して，+3.15 の改善が得られた．

抄録全体を表示

PDF形式でダウンロード (784K)

解説論文

組合せ最適化入門：線形計画から整数計画まで

梅谷俊治

2014 年 21 巻 5 号 p. 1059-1090
発行日: 2014/09/16
公開日: 2014/12/16

DOIhttps://doi.org/10.5715/jnlp.21.1059

ジャーナルフリー

抄録を表示する抄録を非表示にする

線形計画問題において変数が整数値を取る制約を持つ整数計画問題は，産業や学術の幅広い分野における現実問題を定式化できる汎用的な最適化問題の 1 つであり，最近では分枝限定法に様々なアイデアを盛り込んだ高性能な整数計画ソルバーがいくつか公開されている．しかし，整数計画問題では線形式のみを用いて現実問題を記述する必要があるため，数理最適化の専門家ではない利用者にとって現実問題を整数計画問題に定式化することは決して容易な作業ではない．本論文では，数理最適化の専門家ではない利用者が現実問題の解決に取り組む際に必要となる整数計画ソルバーの基本的な利用法と定式化の技法を解説する．

抄録全体を表示

PDF形式でダウンロード (728K)

J-STAGEへの登録はこちら（無料）