- Info
abstract_sugiyama
講演者:
杉山 将(東京工業大学 計算工学専攻)
題目:
確率的パターン認識とクラスタリングの新手法
概要:
本講演では,講演者のグループで最近開発した確率的パターン認識とクラスタリングの新手法を紹介する.
確率的パターン認識は,パターンxがクラスyに属する確率p(y|x)を推定し,この確率を最大するクラスyにパターンxを割り当てるパターン認識法である.
確率的パターン認識の代表的な手法は(カーネル)ロジスティック回帰であるが,非線形最適化問題を準ニュートン法などで解く必要があるため,大規模なデータに適用するのが困難であった.
そこで我々は,最適解が解析的に求められる手法「最小二乗確率的分類器(LSPC)」を提案した[1].
LSPCは,カーネルロジスティック回帰と同等の認識精度を維持しつつ,数百~千倍高速に学習できることを実験的に示す.
クラスタリングの目的は,似たパターンに同じクラスラベルを,似ていないパターンに異なるクラスラベルを割り当てることである.
これまでに,様々なクラスタリング手法が提案されてきたが,アルゴリズムの適切な初期化が困難であったり,カーネル幅や近傍数などのパラメータの決定が困難であるという問題があった.
そこで我々は,初期値に依存せず解析的に解を求められるクラスタリング法「二乗損失相互情報量クラスタリング(SMIC)」を提案する共に,カーネル幅や近傍数などのパラメータを客観的に決定するための規準「最小二乗相互情報量(LSMI)」を提案した[2].提案手法の有効性を計算機実験により示す.
参考文献:
[1] Sugiyama, M.
Superfast-trainable multi-class probabilistic classifier by least-squares posterior fitting.
IEICE Transactions on Information and Systems, vol.E93-D, no.10, pp.2690-2701, 2010.
http://sugiyama-www.cs.titech.ac.jp/~sugi/2010/LSPC.pdf
[2] Sugiyama, M., Yamada, M., Kimura, M., & Hachiya, H.
On information-maximization clustering: tuning parameter selection and analytic solution.
International Conference on Machine Learning (ICML2011), pp.65-72, 2011.
http://sugiyama-www.cs.titech.ac.jp/~sugi/2011/ICML2011a.pdf
本を2冊出します!:
Sugiyama, M., Suzuki, T., & Kanamori, T.
Density Ratio Estimation in Machine Learning,
Cambridge University Press, 2012
Sugiyama, M. & Kawanabe, M.
Machine Learning in Non-Stationary Environments
MIT Press, 2012