自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
26 巻, 2 号
選択された号の論文の10件中1~10を表示しています
巻頭言
論文
  • Akira Miyazawa, Yusuke Miyao
    2019 年 26 巻 2 号 p. 277-300
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    The automatic generation of metaphorical expressions helps us write imaginative texts such as poems or novels. This paper proposes a new metaphor generation task, evaluation metrics, and a method to solve the task. Our task is formalized as a problem of finding metaphorical paraphrases for a literal Japanese phrase consisting of a subject, an object, and a verb. We use four evaluation metrics: synonymousness, metaphoricity, novelty, and comprehensibility. Our proposed method generates metaphorical expressions by using three automatically computable scores—similarity, figurativeness, and rarity—corresponding to one of the evaluation metrics. By crowdsourcing, we show how these scores are related to those given by humans in terms of the evaluation metrics and how they are useful in finding human’s preferred expressions in pairwise comparisons.

  • 浅原 正幸
    2019 年 26 巻 2 号 p. 301-327
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    本論文では,リーダビリティ評価を目的として,日本語テキストの読み時間と節境界分類の対照分析を行う.日本語母語話者の読み時間データ BCCWJ-EyeTrack と節境界情報アノテーションを『現代日本語書き言葉均衡コーパス』上で重ね合わせ,ベイジアン線形混合モデルを用いて節末で,どのように読み時間が変わるかについて検討した.結果,英語などの先行研究で言われている節末で読み時間が長くなるという wrap-up effect とは反対の結果が得られた.他の結果として,節間の述語項関係が読み時間の短縮に寄与することがわかった.

  • Ritsuko Iwai, Daisuke Kawahara, Takatsune Kumada, Sadao Kurohashi
    2019 年 26 巻 2 号 p. 329-359
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    To communicate with humans in a human-like manner, systems need to understand behavior and psychological states in situations of human-machine interactions, such as in the cases of autonomous driving and nursing robots. We focus on driving situations as they are part of our daily lives and concern safety. To develop such systems, a corpus annotated with behavior and subjectivity in driving situations is necessary. In this study, subjectivity includes emotions, polarity, sentiments, human judgments, perceptions, and cognitions. We construct a driving experience corpus (DEC) (261 blog articles, 8,080 sentences) with four manually annotated tags. First, we annotate spans with driving experience tags (DE). Then, three tags, other’s behavior (OB), self-behavior (SB), and subjectivity (SJ), are annotated within DE spans. In addition to describing the guidelines, we present corpus specifications, agreement between annotators, and three major difficulties during the development: the extended self, important information, and voice in mind. Automatic annotation experiments were conducted on the DEC using Conditional Random Fields-based methods. On the test set, the F-scores were about .55 for both OB and SB and approximately. 75 for SJ, respectively. We provide error analysis that reveals difficulties in interpreting nominatives and differentiating behavior from subjectivity.

  • 鈴木 類, 古宮 嘉那子, 浅原 正幸, 佐々木 稔, 新納 浩幸
    2019 年 26 巻 2 号 p. 361-379
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    all-words 語義曖昧性解消(以下 all-words WSD (word sense disambiguation))とは文書中のすべての単語の語義ラベルを付与するタスクである.単語の語義は文脈,すなわち周辺の単語によって推定でき,周辺の単語同士が類似している場合中心の単語同士の語義も類似していると考える.そこで本研究では,対象単語とその類義語群から周辺単語の分散表現を作成し,ユークリッド距離を計算することで対象単語の語義を予測した.また,語義の予測結果をもとにコーパスを語義ラベル列に変換し,語義の分散表現を作成した.語義の分散表現を用いて周辺単語ベクトルを作成し直し,再び語義の予測を行った.コーパスには分類語彙表番号がアノテーションされた『現代日本語書き言葉均衡コーパス』(BCCWJ) を利用した.本研究では分類語彙表における分類番号を語義とし,類義語も分類語彙表から取得した.本研究では,提案手法とランダムベースライン,Pseudo Most Frequent Sense (PMFS),Yarowsky の手法,LDAWN を比較し,提案手法が勝ることを示した.

  • 青木 竜哉, 笹野 遼平, 高村 大也, 奥村 学
    2019 年 26 巻 2 号 p. 381-406
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    ソーシャルメディアにおいては,辞書に掲載されているような用法とは全く異なる使われ方がされている単語が存在する.本論文では,ソーシャルメディアにおける単語の一般的ではない用法を検出する手法を提案する.提案手法では,ある単語が一般的ではない使われ方がされていた場合,その周辺単語は一般的な用法として使われた場合の周辺単語と異なるという仮説に基づいて,着目単語とその周辺単語の単語ベクトルを利用し,注目している単語の周辺単語が均衡コーパスにおける一般的な用法の場合の周辺単語とどの程度異なっているかを評価することにより,一般的ではない用法の検出を行う.ソーシャルメディアにおいて一般的ではない用法を持つ40単語を対象に行った実験の結果,均衡コーパスと周辺単語ベクトルを用いる提案手法の有効性を確認できた.また,一般的でない用法の検出においては,単語ベクトルの学習手法,学習された単語ベクトルの扱い方,学習コーパスを適切に選択することが重要であることがわかった.

  • 宮崎 千明, 佐藤 理史
    2019 年 26 巻 2 号 p. 407-440
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    「こりゃひでえ」(元の形:「これはひどい」)のような音変化表現は,対話エージェントの発話や小説のセリフの自動生成において,話者であるキャラクタを特徴付けるための強力な手段となると考えられる.音変化表現を発話のキャラクタ付けに利用するために,本研究では,(i) キャラクタの発話に現れる音変化表現を収集し,(ii) それらを基に,音変化表現を人為的に発生させるための知識を整理した.具体的には,収集した音変化表現を現象と生起環境の観点で分類し,137 種類のパターンとして整理した.そして,これらのパターンが小説やコミックで用いられる音変化表現の 80% 以上をカバーすることを確認した.さらに,(iii) 音変化表現がキャラクタらしさを特徴付ける手段になるという仮説を検証するために,小説やコミックにおける発話文の話者(キャラクタ)を推定する実験を行い,音変化表現のパターンの情報を利用することで,推定性能が向上するキャラクタが存在することを確認した.

  • 田中 貴秋, 永田 昌明
    2019 年 26 巻 2 号 p. 441-481
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    本論文では,従来の文節依存構造(文節係り受け)による構文解析と異なり,解析結果の部分構造が構文の構成素 (constituent) と一致し,解析結果から文法機能情報を直接取得できる日本語の構文解析を提案する.提案する構文解析は,単語間の依存構造に基づき,依存構造に付加されたラベル(文法機能タイプ)により格関係や連体修飾節の種別等の統語情報(文法機能情報)を表示する.この特徴により,文節依存構造解析では通常別工程として処理していた述語項構造解析を,単語依存構造解析では構文構造と自然に統合して扱うことが可能になる.京都大学テキストコーパス,現代日本語書き言葉均衡コーパスの一部に対して構築したコーパスを用いた評価実験により,単語依存構造解析は,従来の文節依存構造解析とほぼ同等の精度を保ちつつ,述語項構造情報等の詳細な統語情報を獲得可能であることを報告する.

  • 珊瑚 彩主紀, 西川 仁, 徳永 健伸
    2019 年 26 巻 2 号 p. 483-508
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    本稿では,日本語述語項構造解析に分野適応の技術を導入することを提案する.述語項構造がアノテーション付けされた現代日本語書き言葉均衡コーパス (BCCWJ-PAS) において,メディアの違いにより項の種類の出現頻度が異なることがわかった.特に外界照応においてその傾向は顕著である.過去の日本語述語項構造解析の多くは,新聞記事コーパスを対象にしているために,この傾向には注目していなかった.この問題に取り組むため,まず,RNN ベースの述語項構造解析器をベースラインとして使用し,3 種類の異なる分野適応技術とその組み合わせを導入した.現代日本語書き言葉均衡コーパス (BCCWJ-PAS) を用いた評価実験では,述語項構造解析には分野依存性があることがわかった.特にガ格とヲ格の解析では,分野適応が日本語述語項構造解析の性能向上に有効であることが確認され,QA テキストの解析においてベースラインと比較し F1 値が最大で,0.030 向上した.

  • 山城 颯太, 西川 仁, 徳永 健伸
    2019 年 26 巻 2 号 p. 509-536
    発行日: 2019/06/15
    公開日: 2019/09/15
    ジャーナル フリー

    本論文では日本語文内・文間ゼロ照応解析モデルを提案する.文間ゼロ照応解析において複数格の同時推定を行う際,複数の文をまたぐ大量の格要素の組合せ候補を取り扱う必要があり,これはゼロ照応解析モデルの訓練,解析に際して重大な障害となる.この問題に対して,我々は格フレームの情報を用いた効果的な解候補削減手法を提案する.提案解候補削減を用いて複数格を同時推定したモデルと解候補削減を用いずにそれぞれの格を独立に推定したモデルを日本語均衡コーパス上で比較し,0.056 の精度向上を確認した.また,ローカルアテンション付き RNN を導入することで,文間ゼロ照応解析の精度が上昇することも確認した.

feedback
Top