2017 年 10 巻 3 号 p. 186-194
記述長最小原理(MDL原理)はできるだけ短い符号長でデータを符号化することにより,情報源の推定や予測のための最適戦略を与えるものである.それは機械学習やデータマイニングにおけるアルゴリズムの統一的設計指針を導き,知識発見のコア技術として年々その活用は発展している.これまでMDL 原理は定常的な仮定の下で,正則なモデルを選択するためのモデル選択原理として漸近的な形で与えられ,その適用範囲はある意味制限されていた.本稿では,MDL原理の基礎から始めて,最近の発展,特に,非正則,非漸近,非定常,非確率的といった状況でMDL原理を適用するための方法論についての最近の研究動向を示す.また,データマイニング応用についても言及する.