hirschkalb's blog

"I beseech you, in the bowels of Christ, think it possible that you may be mistaken."

機関車問題

こんな問題がある。

鉄道会社であるエヌ社は自社の車両に1番から順番にN番までの番号を振っている。路地を散歩していたあなたはエヌ社の車両が海を渡るのをみた。その車両には、60番とあった。エヌ社はいったい何台の車両を保有しているのだろう。

一方でこんな問題がある。

博士とエス氏の目の前に、6面サイコロと60面サイコロと120面サイコロがある。博士はエス氏に問うた。「3つのサイコロのうち、私が一つを選び振ったところ、60が出ました。私はどのサイコロを振ったと思いますか」

鉄道車両の前にサイコロの方を考える。まず、6面サイコロは除外できる。6面サイコロから60という目は出ないのだから。つぎに、120面サイコロを振って60が出ることと、60面サイコロを振って60が出ることと、どちらが起こりやすそうかを考える。そうすると、60面サイコロを振ったと考えるべきだろう。

さて、鉄道だ。同じようにしてエヌ社は全部で60車両だけ保有していると答えるべきだろうか。……何か違うような気がする。

それでは、何が違うのだろうか。 

サイコロの話と鉄道の話は何が違うのだろう。あなたがたまたま見かけた車両の番号は、エヌ社謹製「鉄道車両番号サイコロ」が振られた結果をみたようなものではないか。そしてあなたは60番をみたのだから、そのサイコロの面数は必ず60以上あるはずで、60という目をもっとも出しうるのは面数がちょうど60ぴったしのときだろう……どうなんだろう。

私が平凡な人間ならば(平凡の原理により)このような疑問を抱いている人はありふれているはずだ! はたして、そのような疑問を投げかけている人はいた。

math.stackexchange.com

It seems to me that the best answer (if you have to choose a single value) is that there are 60 locomotives. If there are 60 locomotives, then the probability of my selecting the 60th locomotive at random is 1/60. Every other total number of locomotives gives a lower probability for selecting #60.

[...]

Have I missed something, or is my analysis correct?

(60車両と答えるのが正しいと思うのですが。もし60車両あれば、60番車両をみる確率は1/60です。このほかのどんな車両数をあてがってみても、車両数を60としたときの確率は下回ってしまいます。

(中略)

何か間違っているでしょうか。それともこれであっていますか)

先日「P(A|B)とP(B|A)は一緒ではない」的なことを書いておきながら、みずからそれにハマっていたんだなあ。答えの一部はこんな感じ;

You seem to be analyzing the question from the perspective of "If there are N locomotives, what is the chance of seeing Locomotive 60?", while the correct way to analyze it is "If I see Locomotive 60, what is the chance that there are N locomotives."

(車両がN台あるときに60番車両をみかける確率と、60番車両をみかけたときに車両がN台ある確率*1は別の問題ですが、質問者さんが書いたのは前者に関するものじゃないかと思います)

 まあ、次なる疑問はこれですよね。

P(60番観測|N車両保有)とP(N車両保有|60番観測)が異なるのはわかった。それではあらためて問おう、P(N車両保有|60番観測)はいったいいくらなのか。

とりあえず日付またぎたくないのでリンクだけメモって寝る!*2

German tank problem - Wikipedia, the free encyclopedia

Bias of an estimator - Wikipedia, the free encyclopedia

Minimum-variance unbiased estimator - Wikipedia, the free encyclopedia

Estimation

以下はちょう個人的な計算結果(ちょっとあとで検証したいわけ)。

-3.182 <= {(7.25-m)*sqrt(3)}/4.99 <= 3.182

www.wolframalpha.com 

*1:シメオン=ドニ・ポアソンとアントワーヌ・オーギュスタン・クールノーは、フランス語で、認識論的な確率にはchance(シャーンス)を、偶発的な確率にはprobabitité(プロバビリテ)を使うことを唱えたんだそう(『「偶然」の統計学』より)。今回の引用に関係あるのかしらんけど……。

*2:しかしことごとく日本語版ページがないかあるいはあっても分量少なめなのは……ある意味英語を読むっきゃない環境に置かれているわけで、実はとても感謝している。私が読み終わるまで誰も日本語に訳さないで!

広告を非表示にする