本稿では, 機械翻訳システムの辞書に登録されておらず, かつ (対応付け誤りを含む) 対訳コーパスにおいて出現頻度が低い複合語を対象として, その訳語を抽出する方法を提案する.提案方法は, 複合語あるいはその訳語候補の内部から得られる情報と, 複合語あるいはその訳語候補の外部から得られる情報とを統合的に利用して訳語対候補に全体スコアを付ける.全体スコアは, 複合語あるいはその訳語候補の二種類の内部情報と二種類の外部情報に基づく各スコアの加重和を計算することによって求めるが, 各スコアに対する重みを回帰分析によって決定する.読売新聞とThe Daily Yomiuriの対訳コーパスを用いた実験では, 全体スコアが最も高い訳語対 (のうちのーつ) が正解である割合が86.36%, 全体スコアの上位二位までに正解が含まれる割合が95.08%という結果が得られ, 提案手法の有効性が示された.