4.63%の確率で性器を露出するドラえもん

「5%の確率で性器を露出するドラえもんbot、もちろん知ってますよね。
Twitterの極北を征く者。


彼に対してこのようなリプライが寄せられていた。


なんで性器の露出回数をカウントしているのかはわかりませんが、「299回の性器露出で確率は4.63%」が事実だとしたらえらいことですよね。ちんぽの配給に不正があったということですから。ちんぽの横領が発生しているのかもしれません。このままでは政治的問題にも発展しかねない。

しかし一方で、「性器の露出には偏りがあるはずだから、いつ計測しても5%になるとは限らないんじゃないか?」という冷静な意見もあることでしょう。
コイントスはいつも「表、裏、表、裏、…」になるわけではなく、「裏、裏、表、裏、表、表、表、裏、…」のようになる方が自然。
しかし確率でいうと表と裏は半分ずつ出るはずで、ちんぽも後者のように偏っているのではないか……ということです。

では、確率4.63%が妥当なのか検討してみましょう。

母平均の推定

記事をかいている間に300回目の露出があり、キリがいいのでそのデータをつかいます。

  • 総ツイート:6460回
  • 露出:300回

露出確率は4.64%

これが標本です。
ここで、彼の各ツイートを「露出していないときは0、露出したら1」が立つ数列におきかえて、標本平均と不偏分散を求めます。*1
こんな感じでやっていくのでコーヒーでも飲んでしばらく待っててください。

標本平均
f:id:silver801:20170325182453p:plain
不偏分散
f:id:silver801:20170325182503j:plain

ふたつの値がわかったのでここから母平均を推定する。t分布をつかっても正規分布をつかっても変わらないと思うが、正規分布を用いる。
母平均の95%信頼区間は、
下限
f:id:silver801:20170325184529j:plain
上限
f:id:silver801:20170325184547j:plain
つまり露出確率は4.1%から5.1%の間に収まっていると推定される。*2
公表されている露出確率5%はありうることがわかる。

結論

ドラえもんはちゃんとちんぽ出してる。

*1:統計屋に見られたら怒られそう。間違ってたら教えてください

*2:書き終わってから気づいたけど「母平均」という言葉と「露出確率」という言葉がいれかわって読みにくいですね。すいません