Ci sono 1000 palline, contrassegnate da 1 a 1000. Il banco sorteggia a caso

Ci sono 1000 palline, contrassegnate da 1 a 1000. Il banco sorteggia a caso

(con uguale probabilità fra i numeri da 1 a 1000) un numero n e senza farsi vedere mette in un'urna n palline (quelle numerate da 1 a n), rimescolando poi accuratamente
indovinare quante sono le n palline nell'urna.
Tu, giocatore, scegli e punti un numero m: se n=m indovini e vinci (lasciamo perdere la quota di vincita, non interessa).
L'impresa è ardua, perché la probabilità di indovinare è di 1 su 1000, ma inaspettatamente ti arriva una soffiata: un amico ti dice che sbirciando dentro l'urna ha visto che contiene parecchie palline e in particolare è riuscito a leggere il numero 901 su una di esse.
Bene! Ora sai che 900 < n < 1000 e puoi quindi escludere i numeri fra 1 e 900.
Se tu potessi puntare su tutti i 100 numeri da 901 a 1000, saresti sicuro di azzeccare n e vincere.
Ma puoi scegliere un numero solo.
Su quale numero ti conviene puntare?
la probabilità di indovinare il numero n delle palline contenute nel sacchetto è:
0,0105397 se si dice 901
0,0104354 se si dice 910
0,0103220 se si dice 920
0,0102110 se si dice 930
0,0101024 se si dice 940
0,0099960 se si dice 950
0,0098919 se si dice 960
0,0097899 se si dice 970
0,0096900 se si dice 980
0,0095921 se si dice 990
0,0094962 se si dice 1000
dire che ci sono almeno 901 palline e dire di aver visto la 901 sono due cose abbastanza differenti.
La seconda implica la prima ma non viceversa.
Se io so che ci sono almeno 901 palline non ho nessun motivo per stimare il numero delle palline in 901 anzicheé un numero superiore.
Aver *visto* la 901 invece mi dà informazione.
Mi dice che e

 successa una cosa, e mi induce a pensare "ma..., se fossero 936, pescandone una a caso quante volte pescherei la 901? e se fossero proprio 901?" innescando quindi il meccanismo di Bayes.</div>
</div>
<div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql">
<div dir="auto">Se invece di 1000 le palline fossero al massimo 10, e l'amico mi dice che ha visto nel sacchetto la pallina n 1, questa informazione, apparentemente priva di valore, mi consente di scommettere che nel sacchetto c'è una sola pallina, e la probabilità di indovinare sale dal 10% al 34,14%.</div>
</div>
</div>
<div dir="auto"></div>
<div dir="auto">
<div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql">
<div dir="auto">Mettiamo che il numero massimo n di palline sia 3.</div>
<div dir="auto">Mettiamo che l'amico abbia sbirciato un 2.</div>
<div dir="auto">Il ragionamento "ovvio ma sbagliato" fa dire che la probabilità di azzeccarci puntando sul 2 è di 1/2, e sul 3 di 1/2.</div>
</div>
<div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql">
<div dir="auto">Ragioniamo invece così:</div>
<div dir="auto">Se le palline fossero 2, l'amico avrebbe probabilità 1/2 di sbirciare il 2.</div>
<div dir="auto">Se le palline fossero 3, l'amico avrebbe probabilità 1/3 di sbirciare il 2.</div>
<div dir="auto">Questo significa che la probabilità che le palline siano 2 è maggiore di quella che le palline siano 3, ed in particolare le due probabilità stanno fra loro nel rapporto 1/2 : 1/3, ovvero 3:2.</div>
<div dir="auto">Ovvero, la probabilità di azzeccarci puntando sul 2 è 0,6, mentre quella di azzeccarci puntando sul 3 è 0,4.</div>
</div>
<div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql">
<div dir="auto">O anche:</div>
<div dir="auto">Supponiamo che il numero massimo di palline sia tre, e che l'amico abbia sbirciato una delle palline.</div>
<div dir="auto">A questo punto le probabilità sono le seguenti: le indico nella forma m(n) intendendo che ci sono n palline nell'urna e lui ha sbirciato la pallina m.</div>
</div>
<div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql">
<div dir="auto">1(1) = 1/3</div>
<div dir="auto">1(2) = 1/6</div>
<div dir="auto">2(2) = 1/6</div>
<div dir="auto">1(3) = 1/9</div>
<div dir="auto">2(3) = 1/9</div>
<div dir="auto">3(3) = 1/9</div>
</div>
<div class="o9v6fnle cxmmr5t8 oygrvhab hcukyx3x c1et5uql">
<div dir="auto">Posto che la pallina vista e

la 2, solo il terzo e il quinto caso sono possibili: rinormalizzando abbiamo

2(2) = 3/5
2(3) = 2/5
quindi conviene dire che ci sono due palline nell'urna.
Che il risultato sia corretto è assolutamente certo, ad es. una simulazione su 10 milioni di "estrazioni" lo riproduce perfettamente.
la probabilità sia costante e pari all'1% nel caso specifico. Per verificare questo ho scritto un programma facendo 100 milioni di iterazioni che conferma che i 100 numeri sono equiprobabili.
Nel dubbio che la funzione randomica utilizzata possa essere affetta da una distribuzione non perfettamente costante (che su 100 numeri potrebbe nascondere piccole differenze) ho provato anche il caso da te riportato di 3 palline con il 2 visto ma ho ottenuto anche qui piccolissimi scostamenti dal 50% (invece che 3/5 e 2/5).
Mi viene però il dubbio dall'esempio che hai fatto sulle 3 palline che di fondo ci sia una differente interpretazione della probabilità e quindi dell'algoritmo utilizzato per verificarla in modo simulato.
Quello che ritengo vada calcolata è la probabilità condizionale all'evento "è stato sbirciato il 2" (o il 901). In questo senso le probabilità che hai usato (2(2) = 1/6; 2(3) = 1/9) per calcolare rispettivamente 3/5 e 2/5 sono affette anche ad esempio dalle 1(1) = 1/3 e 1(2) = 1/6 che, una volta nota l'estrazione del 2, di fatto non sono più possibili. Mi domando se rimodulare la probabilità 2(2) e 2(3) con i pesi che non tengono in considerazione la sbirciata risponda al quesito.
Simulazione considerando un massimo n di 100 palline e ammettendo di aver visto che nel sacchetto è presente (m) la n.91.
DIM a(100)
CLS
FOR i = 1 TO 10
a(i) = 0
NEXT i
RANDOMIZE TIMER
FOR i = 1 TO 1000000000
n = INT(RND*100) + 1
IF n < 91 THEN GOTO 20
m = INT(RND*n) + 1
IF m = 91 THEN a(n - 90) = a(n - 90) + 1
20 NEXT i
FOR i = 1 to 10
PRINT a(i);
NEXT i
END
I valori di probabilità (P_c = probabilità calcolata; P_s = probabilità simulazione) ottenuti con 500 milioni di sorteggi sono:
91) P_c= 0,10485 ........... P_s = 0,10481
92) P_c= 0,10371 ........... P_s = 0,10362
93) P_c= 0,10259 ........... P_s = 0,10248
94) P_c= 0,10150 ........... P_s = 0,10175
95) P_c= 0,10044 ........... P_s = 0,10047
96) P_c= 0,09939 ........... P_s = 0,09954
97) P_c= 0,09836 ........... P_s = 0,09821
98) P_c= 0,09736 ........... P_s = 0,09730
99) P_c= 0,09638 ........... P_s = 0,09641
100) P_c= 0,09541 ........... P_s = 0,09542
l'interpretazione della probabilità condizionale che abbiamo dato è diversa. La mia in codice (utilizzando lo stesso tuo linguaggio) sarebbe la seguente:
DIM a(100)
CLS
FOR i = 1 TO 10
a(i) = 0
NEXT i
RANDOMIZE TIMER
FOR i = 1 TO 1000000000
n = INT(RND*100) + 1
IF n < 91 THEN GOTO 20
a(n - 90) = a(n - 90) + 1
20 NEXT i
FOR i = 1 to 10
PRINT a(i);
NEXT i
END
seconda estrazione randomica perchè il filtro su n<91 è sufficiente per determinare le casistiche "utili" alla simulazione. Per quelle che hanno n>=91 il 91 può essere spiato senza doverlo estrarre (dal mio punto di vista) perchè è un evento certo, ovvero se c'è il 91 sicuramente

About Post Author

pasquale.clarizio

error: Content is protected !!
Advertisment ad adsense adlogger