ベイズ定理 (Bayes' Theorem)
SPAMフィルタの仕組みを調べると、ベイズ定理。
協調フィルタリングの論文を読むと、ベイズ定理。
ということで、ちょっと調べ物をすると、必ずでてくるのが、このベイズ定理です。
もっとも簡単なものを数式で書くと…
P(D|H) x P(H) P(H|D) = ---------------- P(D)
ってやつですね。
(´・ω・`) さっぱり、意味がわかりませぬ(爆)
ということで、流石に勉強せねばいかんでしょ〜と思い、某所で「分かりやすい」「これは入門向けだ」と絶賛されていたこちらの本を購入してみました。
よんで、なっとくしました。
こんな簡単な式で、物凄いことがわかるんですね。
ベイズのおっさん、(・∀・)チゴイネ!!
シンプルな式ほど、非常に強力だっていうけど、本当だね。
いや〜、理系学部を卒業した力をもってすれば、こんな式を理解するのは余裕っすよ。
やほ~い ヽ(゜∀゜)メ(゜∀゜)メ(゜∀゜)ノ やほ~い
ごめんなさい、うそつきました
ぜ〜んぜんわかりません (゜∀゜)アヒャヒャヒャヒャ
P(H|D)とP(D|H)って、なんだYO!
データDの確率P(D)って、いったい何なのさ?
そもそも、かくりつとーけー、苦手なんだよ〜
高校生時代から、(|| ゜Д゜)トラウマーなんだよ〜
さいころを3個ふって、出た目の合計が12の確率なんて、知るかぁ!
じゃんけんに勝つ確率1/3っていうけど、おいらはもっと負けてるぞ〜
競馬なんか、めったに勝てないぞ〜
あれもこれも、すべて確率統計が悪いんだ〜い
(これでも一応自称研究者w)
てか、
Hは仮説を、Dはデータを示し、P(H)はデータを得る前の(すなわち事前の)仮説Hについての確信の度合いを表す主観確率を、左辺のP(H|D)はデータDを得た後の(すなわち事後の)仮説Hについての確信の度合いを表す主観確率を示している。P(D|H)は仮説HのもとでデータDが発生する確率であるが、データが発生してしまった後はもはや確率ではなくなるため、仮説Hについての尤度とよばれる。
とか書かれても、分かる人には分かりやすいのかもしれませんが、おいらには理解不能です(泣)
というおいらでしたが、先日こちらのネ申サイトを発見。
http://yudkowsky.net/bayes/bayes.html
定期検診を受ける40歳女性の1%が乳がんにかかっています。
乳がんにかかっている女性のうち、マンモグラフィを受けて陽性判定が出るのは80%です。
乳がんにかかっていない女性のうち、マンモグラディを受けて陽性判定が出るのは9.6%です。
さて、ある女性がマンモグラフィを受けて陽性判定が出た場合、この女性が実際に乳がんにかかっている確率は何パーセントでしょう?
という実例に始まり、とっても丁寧にベイズ定理の基礎を教えてくれるサイトでございます。
ちなみに、上記確率の問題がさっぱり解けない人でも大丈夫。
ちゃんと解けるように、確率の基礎の基礎からじっくり説明してくれるので、多いときも安心です(?)
ちなみに上記問題を医者に出す実験が行われたそうなのですが、「70%〜80%」と誤答した医者が多数いたとか。
てか、医者が間違えちゃだめでしょ(笑)
誤答したやつ、正直に手を上げなさい!
( ・ω・)∩
…まぁ、そんなこんなで非常に優れた(難しい概念を平素な文章で簡潔に説明している)テキストなのですが、残念ながら「英語」でかかれているので、人によってはちとツライかもしれません。(そんなに難しい単語は使われていませんが…)
願わくば、こんな説明文が日本語で読めるようになっていたらいいなぅ、と思う今日この頃っす。
だれか訳しません?(笑)
訳す際には、是非ともオリジナルのテーストを生かした感じでよろしくです〜
(例)"Fun Fact!"の2つめ
Q. 事前確率って、どうやって知ることができるの?
A. よく使われる事前確率は、化学・物理のハンドブックを見ればおっけー
Q. じゃぁ、そのハンドブックにのってる事前確率はどこからきたのさ?
A. …そんなこと言う人は嫌いです。
(以下略)