のぴぴのメモ

自分用のLinuxとかの技術メモ

パターン認識と機械学習の詩的な説明にゾクゾク来た話

数年前、AIが流行り始めた時に機械学習がなんぞやと調べて時に出たったShieShareのイントロの「識別・認識とは?」の説明が、詩的ででもわかりやすくて、その時ゾクゾクと来たのを思い出したので、備忘録がてら引用しておきます。

ちなみに本文は数学者の方のスライドなので難しくてよくわかりませんでしたが(笑)

www.slideshare.net

上記SlideShareのP19-32から引用

認識とは、不要な情報を捨てること

特徴選択・特徴抽出が
識別・認識の本質

パターン認識機械学習においては
これを忘れてはいけません

色々な特徴や次元を
考えることは
とても役に立つことですが

知っている特徴や次元を
何も考えず全部手元に置いておくと
人間は高次元ユークリッド空間で
迷子になってしまいます

高次元ユークリッド空間は
私たちの感覚と乖離しやすく

もしあなたが無限次元の
ユークリッド空間に放り出されたら
見渡す限り全てのものが
あなたからはるかに遠くにあって
何も見分けがつかなるくなるような
そんな空間です

これは「次元の呪い」
と言われています

いいものも悪いものも
好きなものも嫌いなものも
関係あるものも関係ないものも

見分けがつかなくなってしまう
恐ろしい「呪い」ですね!

つまりあなたか
ヒルと白鳥の
雑多な集団の中から
白鳥を探し出しないのなら

まずあなたはあなたが
白鳥の
どの特徴を選択・抽出して
白鳥を白鳥と
認識しているのか
なるべく正確に
見つける必要があります