自然言語処理
Online ISSN : 2185-8314
Print ISSN : 1340-7619
ISSN-L : 1340-7619
最新号
選択された号の論文の18件中1~18を表示しています
巻頭言(査読無)
一般論文(査読有)
  • 菅野 祐希, 坂野 遼平
    2025 年32 巻3 号 p. 770-799
    発行日: 2025年
    公開日: 2025/09/15
    ジャーナル フリー

    近年のインターネットやスマートフォンの普及により,動画共有サービスに多くの人がアクセスするようになった.YouTube や TikTok に代表される動画共有サービスは,現代において様々な人の行動や選択に大きな影響力を持つようになっている.それにより動画共有サービスはビジネスやマーケティングの場としても活用されるようになった.視聴者が動画を閲覧することでどのような感情を得るかという情報は,視聴者とマーケターの両方において有益となる.本稿では,オンライン動画共有サービス上にアップロードされた動画に付けられたコメントから,動画の視聴者に引き起こされる感情の推定を行う手法を提案する.BERT 及び数種類の大規模言語モデル (LLM) を用い,動画コメントを利用した各モデルの感情推定に関する能力の違いを明らかにする.提案手法では,7 種類の感情の強さを成分とした 7 次元ベクトルにより感情を表現し,推定を行う.実験の結果,100 件のコメントを使用して精細な感情の強度を推定する場合には LLM が優位であることが分かった.また,10 件の少ないコメント件数から最も強い感情を推定する場合,BERT が高いスコアを示した.

  • 小早川 健, 榊 剛史, 大知 正直, 坂田 一郎
    2025 年32 巻3 号 p. 800-828
    発行日: 2025年
    公開日: 2025/09/15
    ジャーナル フリー

    テレビ番組のコンテンツ中のどのシーンへの反響が大きいかを知ることは,番組制作の分析,改善において重要である.特にオンエア中のテレビ番組を視聴しながら発信されるコメント(リアルタイムコメント)は映像を視聴した直後に発信されるフィードバックであり,分析対象として適している.従来研究では,テキストの内容か,もしくは,発信時刻のどちらか一方に重きを置くものが主流であり,長文のコメントなど投稿までに時間を要するものをシーンに適切に対応づけることは困難であった.そこで,この研究では,リアルタイムコメントに対して,そのコメントが言及しているシーンへ対応付けるための新たな手法を提案する.リアルタイムコメントの発信時刻と,それによって言及される番組シーンの放送時間との差は,かなりのばらつきがあり一様ではない.この時間差を扱うことが重要であるという見込みのもと,時間差を連続値として予測する回帰型のサブタスクを設定し,そのモデル化を行った.そして,このサブタスクを活用して,リアルタイムコメントのシーン別クラスタリングの大幅な精度改善を実現できることを示した.提案法は,テキストと発信時刻の両方を活用できる手法であり,サブタスクのためのモデルには,対照学習による単語埋込み層と全結合型の回帰層を統合したニューラルネットワークを採用することが有効であった.本研究の成果によって,SNS 発信を用いた番組シーンの評価をより深く番組の内容を理解しているユーザーのコメントによって行うことができるため,これまでよりも多様な映像表現への改善に活用できる可能性がある.

  • 橋本 航, 上垣外 英剛, 渡辺 太郎
    2025 年32 巻3 号 p. 829-858
    発行日: 2025年
    公開日: 2025/09/15
    ジャーナル フリー

    本研究では,データ拡張が固有表現抽出 (Named Entity Recognition; NER) タスクにおける不確実性推定性能に与える影響を調査する.ヘルスケアや金融などの安全性が極めて重要な領域でNERを活用するには,事前学習済み言語モデルを含むディープニューラルネットワーク (Deep Neural Network; DNN) の予測の信頼性が高いことが必要不可欠である.しかし,DNN は誤較正を起こしやすいため,その適用範囲は限定されている.さらに,既存の不確実性推定手法は複数回の確率的推論を必要とするため計算コストが高いという問題がある.本研究では,NER のデータ拡張により特にドメイン内設定で不確実性推定性能が改善されることがわかった.また,データ拡張サイズを大きくすることでさらに NER の不確実性推定性能が改善され,その傾向はデータ拡張によって生成された文のパープレキシティと関連していることを示唆している.

  • Haruki Sakajo, Yusuke Sakai, Hidetaka Kamigaito, Taro Watanabe
    2025 年32 巻3 号 p. 859-885
    発行日: 2025年
    公開日: 2025/09/15
    ジャーナル フリー

    How human vocalizations are articulated can be described by analyzing the tongue position. Researchers have discovered this through lived experience and detailed observation, including by MRI. Using this knowledge and personal experience, teachers can understand and explain the relationship between tongue positions and vowels, thus helping language students to learn pronunciation. Our preliminary studies suggest that language models (LMs), trained on extensive data from the linguistic and medical fields, can explain the mechanisms of vowel pronunciation. However, it is unclear whether multimodal LMs, such as Large-scale Vision Language Models (LVLMs), sufficiently align textual information with visual information. From this, the research question arises: Do LVLMs associate real tongue positions with vowel articulation? To investigate whether visual information can help LVLMs understand vowel articulation based on tongue positions, this study created video and image datasets from real-time MRI samples. We discuss how LVLMs predict vowels by analyzing several experimental results. Our findings suggest that LVLMs can potentially identify the interrelationship between vowels and tongue positions when reference examples are provided, but have difficulty without them. LVLMs also perform better when inferring directly from visual information than when offered text descriptions before inferring.

  • Huayang Li, Deng Cai, Zhi Qu, Qu Cui, Hidetaka Kamigaito, Lemao Liu, T ...
    2025 年32 巻3 号 p. 886-917
    発行日: 2025年
    公開日: 2025/09/15
    ジャーナル フリー

    Phrase-level dense retrieval has shown many appealing characteristics in downstream NLP tasks by leveraging the fine-grained information that phrases offer. In our work, we propose a new task formulation of dense retrieval, cross-lingual contextualized phrase retrieval, which aims to augment cross-lingual applications by addressing polysemy using context information. However, the lack of specific training data and models are the primary challenges to achieve our goal. As a result, we extract pairs of cross-lingual phrases using word alignment information automatically induced from parallel sentences. Subsequently, we train our Cross-lingual Contextualized Phrase Retriever (CCPR) using contrastive learning, which encourages the hidden representations of phrases with similar contexts and semantics to align closely. Comprehensive experiments on both the cross-lingual phrase retrieval task and a downstream task, i.e, machine translation, demonstrate the effectiveness of CCPR. On the phrase retrieval task, CCPR surpasses baselines by a significant margin, achieving a top-1 accuracy that is at least 13 points higher. When utilizing CCPR to augment the large-language-model-based translator, it achieves average gains of 0.7 and 1.5 in BERTScore for translations from X↠En and vice versa, respectively, where X is one of the six Indo-European languages in the WMT16 dataset. It also achieves gains of at least 0.7 BERTScore on translations into East Asian languages, such as Japanese, Chinese, and Korean.

応用システム論文(査読有)
  • 出内 将夫, 笈田 佳彰, 東山 翔平, 田中 英輝, 内山 将夫, 渡辺 太郎
    2025 年32 巻3 号 p. 918-959
    発行日: 2025年
    公開日: 2025/09/15
    ジャーナル フリー

    本稿では,コンポーネント型 ERP パッケージを用いて業務システムを構築するシステム開発者の支援を目的とした,大規模言語モデルを用いたリランキングによるソフトウェア部品推薦システムについて報告する.提案システムでは,リランキングを行うために,外部データを組み合わせた多肢選択問題を作成し,類似検索により訓練データから類似事例を取得して文脈内学習に用いた.これにより,提案システムは従来システムより適合率を 5% 以上向上し,システム開発者にとって有用であることを確認した.また,高精度を達成した大規模言語モデルは,より多くのタスクに関連したテキストで事前訓練され,タスク関連知識を獲得していることが分析から示唆された.

学会記事(査読無)
賛助会員記事(査読無)
後付記事(査読無)
feedback
Top