自然言語処理

音声言語モデルに想うこと (巻頭言に換えて)

市川熹

1999 年 6 巻 2 号 p. 1-8
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_1

ジャーナルフリー

PDF形式でダウンロード (814K)
単語単位による日本語言語モデルの検討

伊東伸泰, 西村雅史, 荻野紫穂, 山崎一孝

1999 年 6 巻 2 号 p. 9-27
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_9

ジャーナルフリー

抄録を表示する抄録を非表示にする

日本語では単語の境界があいまいで, 活用等のルールに基づいて定義された単位である形態素は必ずしも人が認知している単語単位や発声単位と一致しない. 本研究では音声認識への応用を目的として人が潜在意識的にもつ単語単位への分割モデルとその単位を用いた日本語の言語 (N-gram) モデルについて考察した. 本研究で用いた単語分割モデルは分割確率が2形態素の遷移で決定されるという仮定を置いたモデルで, 人が単語境界と考える点で分割した比較的少量のテキストデータと形態素解析による分割結果とを照合することにより, パラメータの推定を行った. そして多量のテキストを同モデルにしたがって分割し, 単語単位のセット (語彙) と言語モデルを構築した. 新聞3誌とパソコン通信の投稿テキストを用いた実験によれば約44,000語で, 出現した単位ののべ94-98%がカバーでき, 1文あたりの単位数は形態素に比べて12%から19%少なくなった. 一方, 新聞とパソコン通信ではモデルに差があるもののその差は単語分割モデル, 言語モデル双方とも事象の異なりとして現れ, 同一事象に対する確率の差は小さい. このため, 新聞・電子会議室の両データから作成した言語モデルはその双方のタスクに対応可能であった.

抄録全体を表示

PDF形式でダウンロード (1779K)
単語知識を必要としない高精度な言語モデル

森大毅, 阿曽弘具, 牧野正三

1999 年 6 巻 2 号 p. 29-40
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_29

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文では, 知識に依存しない, 高い曖昧性削減能力を持つ新しい言語モデルを提案する. このモデルはsuperwordと呼ぶ文字列の集合の上のn-gramとして定義され, 従来の単語や文字列のn-gramモデルを包含するものになっている. superwordは訓練テキスト中の文字列の再現性のみに基づいて定義される概念であり, Forward-Backwardアルゴリズムによって学習される. 実験の結果, superwordに基づくモデルと文字のtrigramモデルを複数融合させたモデルの優位性が示され, 形態素解析に基づく方法および高頻度文字列に基づく方法を上回る性能が得られた.

抄録全体を表示

PDF形式でダウンロード (1152K)
品詞および可変長形態素列の複合N-gramを用いた日本語形態素解析

政瀧浩和, 匂坂芳典

1999 年 6 巻 2 号 p. 41-57
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_41

ジャーナルフリー

抄録を表示する抄録を非表示にする

本論文では, 日本語連続音声認識用のN-gram言語モデルの学習に用いる形態素データを, テキストデータから自動的に生成することを目的として, 品詞および可変長形態素列の複合N-gramを用い, 日本語テキストデータを自動的に形態素解析する手法を提案する. 複合N-gramは, 品詞, 形態素, 形態素列を単位としたN-gramで, 少ないデータ量から高い予測精度を持つ言語モデルである. また, 品詞から未知語が出現する確率を定式化することにより, 未知語の形態素解析を行えるようにモデルの改良を行った. 形態素解析実験の結果, 複合N-gramの形態素同定率は最高99.17%で, 従来のルールベースによる方法よりも正確に形態素の同定が行えることが判明し, 提案手法の有効性を確認した. また, 読みまで含めた評価を行った場合でも, 最高98.68%の正解率が得られた. 未知語を含む文の形態素解析では, 全ての語いが辞書に登録されている場合と比較して0.8%程度の低下に抑えることができた.

抄録全体を表示

PDF形式でダウンロード (1794K)
多段解析法による形態素解析を用いた音声合成用読み韻律情報設定法とその単語辞書構成

浅野久子, 松岡浩司, 高木伸一郎, 小原永

1999 年 6 巻 2 号 p. 59-81
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_59

ジャーナルフリー

抄録を表示する抄録を非表示にする

日本語テキスト音声合成において, 自然で聞きやすい合成音声を出力するためには, 読み, アクセント, ポーズ等の読み韻律情報を正しく設定する必要がある. 本論文では, 複合語等に対しては部分的に深い解析を行うことを特徴とする多段解析法に基づく形態素解析を用いて, 読み韻律情報を設定する方法, および, 読み韻律情報を設定するために用いる単語辞書情報について述べる. 本方式の主な特徴は, 形態素解析における読み韻律情報付与に対応した長単位認定, 複合語内意味的係り受け情報を用いたアクセント句境界設定, 文節問係り受け情報を用いず, 複合語内等の局所構造, およびアクセント句境界前後単語の品詞情報等から得られるアクセント句結合力を用いて段階的にポーズを設定する多段階設定法に基づくポーズ設定である. 本方式をニュース文章を対象に2名の評価者により評価した結果, クローズ評価で95%, オープン評価で91%の精度 (評価者2名の平均) で, 読み韻律情報を正しく設定でき, その有効性が確認できた.

抄録全体を表示

PDF形式でダウンロード (3639K)
発話単位の分割または接合による言語処理単位への変換手法

竹沢寿幸, 森元逞

1999 年 6 巻 2 号 p. 83-95
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_83

ジャーナルフリー

抄録を表示する抄録を非表示にする

自然で自発的な発話を対象とする音声翻訳ないし音声対話システムへの入力としての発話は文に限定できない. 一方, 言語翻訳処理における処理単位は文である. 話し言葉における文に関して, 計算機処理から見て十分な知見は得られていないので, 文の代わりに「言語処理単位」と呼ぶことにする. まず, 一つの発話を複数の言語処理単位に分割したり, 複数の発話をまとめて一つの言語処理単位に接合する必要があることを, 通訳者を介した会話音声データを使って示す. 次に, ポーズと細分化された品詞のN-gramを使って, 発話単位から言語処理単位に変換できることを実験により示す.

抄録全体を表示

PDF形式でダウンロード (1312K)
音声認識用言語モデルのためのタスク適応化と定型表現の利用

中川聖一, 赤松裕隆, 西崎博光

1999 年 6 巻 2 号 p. 97-115
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_97

ジャーナルフリー

抄録を表示する抄録を非表示にする

本研究では大規模コーパスが利用可能な新聞の読み上げ音声の認識のための精度の碁い言語モデルの構築を実験的に検討した. N-gram言語モデルの改善を目指し, 以下の3つの点に注目した. まずN-gram言語モデルはタスクに依存するので, タスクに関する大量のデータベースを用いて構築される必要があることに注目し, 共通の大長データベースによる言語モデルをもとに, 同一ジャンルの過去の記事を用いるタスク適応化の方法とその有効性を示す. 次に, 新聞記事は話題が経時的に変化するので数日間～数週間の直前の記事内容で言語モデルの適応化を行なう方法とその有効性を示す. 最後に新聞テキストには, 使用頻度の高い (特殊) 表現や, 固定的な言い回し毛どの表現 (以下, 定型表現と呼ぶ) が多いことに注目し, 複数形態素から成る定型表現を抽出し, これを1形態素として捉えた上で, N-gram言語モデルを構築する方法を杉討し, 有用性を示す.

抄録全体を表示

PDF形式でダウンロード (3630K)
テキスト音声合成における係り受け解析結果を用いたポーズ挿入処理

佐藤奈穂子, 小島裕一, 望主雅子, 亀田雅之

1999 年 6 巻 2 号 p. 117-132
発行日: 1999/01/10
公開日: 2011/03/01

DOIhttps://doi.org/10.5715/jnlp.6.2_117

ジャーナルフリー

抄録を表示する抄録を非表示にする

我々は, テキスト音声合成システムのポーズ挿入精度向上のために, 言語処理部に構文解析処理を導入し, 一文全体の係り受け解析結果を利用したポーズ挿入処理を試みた. 本稿では, この結果について報告する. テキストを音声に変換して出力する際には, その内容を感覚的, 意味的に捉え易くするために, テキスト中の適当な位置に適当な長さのポーズを与える必要がある. ポーズ位置やポーズ長の設定に, 対象文の係り受け解析結果が有効な手がかりになるとの知見が得られているが, 従来は実施上の都合から, 語彙情報の利用や, 局所的なテキスト解析による方法が代用されていた. そこで本稿では言語処理部に軽量かつ高速な構文解析系を導入し, 一文全体の係り受け解析のシステム上での実現を試みた. ポーズ挿入の生じ易さの指標としてポーズ挿入尤度を設け, 係り受け情報に着目したポーズ挿入規則に基づき, 全文節境界にポーズ挿入尤度を設定する. 尤度の高い境界から基本ポーズ長レベルを設定した後, 各境界に対してアクセント結合処理および呼気段落に基づく閾値による調整を行なう. 実際にテキスト音声合成システムに実装し, 形態素解析と隣接間係り受け処理のみ実装しているテキスト音声合成ソフトウェアパッケージとの比較実験を行なったところ, ポーズ挿入精度の大幅な向上が得られ, その効果を確認することができた.

抄録全体を表示

PDF形式でダウンロード (2792K)

J-STAGEへの登録はこちら（無料）