自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
21 巻, 5 号
選択された号の論文の5件中1~5を表示しています
巻頭言
論文
  • Chenchen Ding, Mikio Yamamoto
    2014 年 21 巻 5 号 p. 981-1009
    発行日: 2014/09/16
    公開日: 2014/12/16
    ジャーナル フリー
    We design a language model based on a generative dependency structure for sentences. The parameter of the model is the probability of a dependency N-gram, which is composed of lexical words with four types of extra tag used to model the dependency relation and valence. We further propose an unsupervised expectation-maximization algorithm for parameter estimation, in which all possible dependency structures of a sentence are considered. As the algorithm is language-independent, it can be used on a raw corpus from any language, without any part-of-speech annotation, tree-bank or trained parser. We conducted experiments using four languages, i.e., English, German, Spanish and Japanese, to illustrate the applicability and the properties of the proposed approach. We further apply the proposed approach to a Chinese microblog data set to extract and investigate Internet-based, non-standard lexical dependency features of user-generated content.
  • 新納 浩幸, 佐々木 稔
    2014 年 21 巻 5 号 p. 1011-1035
    発行日: 2014/09/16
    公開日: 2014/12/16
    ジャーナル フリー
    本論文では語義曖昧性解消(Word Sense Disambiguation,WSD)の教師なし領域適応の問題に対して,共変量シフト下の学習を試みる.共変量シフト下の学習では確率密度比 w(x) = PT(x)/PS(x) を重みとした重み付き学習を行うが,WSD の場合,推定される確率密度比の値が小さくなる傾向がある.ここでは PT(x) と PS(x) をそれぞれ求めて,その比を取ることで w(x) を推定するが,PS(x) を求める際に,ターゲット領域のコーパスとソース領域のコーパスを合わせたコーパスを,新たにソース領域のコーパス S と見なすことで,先の問題に対処する.BCCWJ の 3 つの領域 OC (Yahoo! 知恵袋),PB(書籍)及び PN(新聞)を選び,SemEval-2 の日本語 WSD タスクのデータを利用して,多義語 16 種類を対象に,WSD の領域適応の実験を行った.w(x) を推定する手法として,PT(x) と PS(x) を求めずに,w(x) を直接推定する uLSIF も試みた.また確率密度比を上方修正するために「p 乗する」「相対確率密度比を取る」という手法も組み合わせて試みた.それらの実験の結果,提案手法の有効性が示された.
  • 林 克彦, 須藤 克仁, 塚田 元, 鈴木 潤, 永田 昌明
    2014 年 21 巻 5 号 p. 1037-1057
    発行日: 2014/09/16
    公開日: 2014/12/16
    ジャーナル フリー
    本稿では,機械翻訳の単語並べ替え問題にシフトリデュース構文解析法を応用するための手法を提案する.提案手法では,単一言語の Inversion Transduction 文法によって単語並べ替え問題を定式化する.また,日本語文と英語文との単語対応をとりやすくするため,あらかじめ除去した英冠詞を翻訳結果へ挿入する問題も単語並べ替えと同時に定式化する.提案法を日英特許翻訳に適用したところ,句に基づく統計的機械翻訳の BLEU スコア 29.99 に対して,+3.15 の改善が得られた.
解説論文
  • 梅谷 俊治
    2014 年 21 巻 5 号 p. 1059-1090
    発行日: 2014/09/16
    公開日: 2014/12/16
    ジャーナル フリー
    線形計画問題において変数が整数値を取る制約を持つ整数計画問題は,産業や学術の幅広い分野における現実問題を定式化できる汎用的な最適化問題の 1 つであり,最近では分枝限定法に様々なアイデアを盛り込んだ高性能な整数計画ソルバーがいくつか公開されている.しかし,整数計画問題では線形式のみを用いて現実問題を記述する必要があるため,数理最適化の専門家ではない利用者にとって現実問題を整数計画問題に定式化することは決して容易な作業ではない.本論文では,数理最適化の専門家ではない利用者が現実問題の解決に取り組む際に必要となる整数計画ソルバーの基本的な利用法と定式化の技法を解説する.
feedback
Top