電気関係学会九州支部連合大会講演論文集
平成21年度電気関係学会九州支部連合大会(第62回連合大会)講演論文集
セッションID: 11-1A-04
会議情報

母語話者/非母語話者英語論文コーパスを用いた不自然な英語表現の抽出
水田 貴章冨浦 洋一柴田 雅博木村 恵
著者情報
キーワード: 自然言語処理
会議録・要旨集 フリー

詳細
抄録
WWW上に公開されている大量の英文書を分類することで,大規模な母語話者コーパス(良質な英文書群)および非母語話者コーパス(誤りや不自然な表現を含む英文書群)を構築できる.われわれは,教育的な観点から,これらのコーパスを用いて非母語話者に特有の英語表現を抽出することを目指している. 基本的には,非母語話者コーパスのみに現れ,母語話者コーパスに現れない表現を抽出する.しかし,どれだけ大規模な母語話者コーパスを用いても,すべての自然な英語表現が含まれているとはいえない.また,コーパス構築時に誤識別された文書の影響を考慮する必要がある.本発表では,これらの問題に対処した抽出手法を提案する.
著者関連情報
© 2009 電気関係学会九州支部連合大会委員会
前の記事 次の記事
feedback
Top