小島寛之さん ベイズ統計学入門 読みました。
ベイズは、条件付き確率で、 例えば ツボAとBに 白と黒の球が入ってた時に
とった球が 黒 の場合、 ツボAの確率は ? といった解を求められます。
ベイズ統計の強みは、「データが少なくても推測ができ、データが多くなるほど、正確になる」
という性質と「入ってくる情報に瞬時に反応して、自動的に推測をアップデートする」
という学習機能にあります。
ビジネスでも様々なシーンで利用されているようで、例えば、Windows OS のヘルプで利用されているとのことです。
本書では、下記のような具体的な例を解きながら解説されています。
・買う人 と ひやかし(買わない)の人 を見極める
・検査で陽性だった時のガンの確率
・チョコをもらったら 本命 の確率
・次生まれてくるのが 男の子 の確率
・迷惑メールフィルターの例
ベイズは、下のような公式で表されます。
P(B|A) : AだったときのBの確率
P(A|B) : BだったときのAの確率
P(B) : Bの確率
P(A) : Aの確率
・買う人 と ひやかしの人 を見極める
を例にして、考えていこうと思います。
まず、買う人 と ひやかしの人 の割合、
買う人が、店員に 声をかけるか かけないか
ひやかしの人が、店員に 声をかけるか かけないか
の割合を定義していきます。
買う人 2/10
ひやかし 8/10
声をかける割合
買う人 9/10
ひやかし 3/10
P(B|A) : 声かけた とき 買う人 の確率
P(A|B) : 買った人 だったとき 声をかけた 確率 = 9/10
P(B) : 買う人 の確率 = 2/10
P(A) : 声かけた 確率 = ((2/10X9/10)+(8/10X3/10)) = 18/100+24/100 = 42/100
公式にあてはめると、
P(B|A) = (9/10 X 2/10 ) / (42/100) = 18/42 = 3/7 となります。
本書では、表を使って ベイズ確率を求めていきます。
買う人 | ひやかし | |
---|---|---|
声かける | 2/10 X 9/10 | 8/10 X 3/10 |
かけない | 2/10 X 1/10 | 8/10 X 7/10 |
声をかける ので、表の上の割合だけを考えたとき、
買う人の割合は、全体のどのくらいかを考えます。
(2/10 X 9/10)/(2/10 X 9/10 + 8/10 X 3/10)
18/100 / (18/100+24/100)=18/42 = 3/7
同じですね!
このような説明で、事例が紹介されていきます。
面白かったのが、モンテホール問題というもので、アメリカの懸賞番組の確率を取り上げられてます。
モンテホール問題は、その番組の司会者 モンテホールさん が出すものです。
ドアが3つあって、一つは車が入ってて、2つは はずれです。
挑戦者が、ドアを一つ選びます。
残ったドアのうち 一つ を モンテホールさん が開きます。
挑戦者は、ドアを変えるチャンスが与えられます。
その時、ドアをそのままにするか、変えるかで 確率が変わるのです!
普通に考えると 1/3 のうち 一つ減るので、 1/2 かな? と思うでしょうか?
こちらも参考に)モンテホール問題
大変 勉強になりました。
コメント