ANEXA 2. Studiul unui exemplu de așteptare
Am aruncat
un zar de câteva mii de ori urmărind să observ de câte aruncări este nevoie
pentru a obține un 6. Variabila aleatoare studiată a fost timpul de așteptare
până la apariția unui 6. Calcule elementare arată că dacă sunt independente
și având aceeași probabilitate p,
, unde
și T
este timpul de așteptare până la realizarea unuia
din evenimentele
. În cazul
zarului perfect ar trebui, deci, ca
.
Experimentele au fost împărțite în serii de câte 200 de experiențe. Rezultatele sunt prezentate în tabelele de mai jos.
Tabelul 1. Frecvențe brute în serii de 200 de probe
Nr. |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
1 |
55 |
46 |
38 |
48 |
34 |
54 |
38 |
37 |
40 |
35 |
42 |
36 |
35 |
34 |
45 |
38 |
2 |
22 |
29 |
22 |
36 |
33 |
32 |
28 |
35 |
30 |
36 |
29 |
27 |
33 |
40 |
36 |
42 |
3 |
20 |
33 |
31 |
31 |
35 |
24 |
25 |
32 |
24 |
21 |
17 |
32 |
26 |
34 |
17 |
24 |
4 |
16 |
19 |
27 |
21 |
25 |
19 |
24 |
21 |
17 |
28 |
23 |
23 |
14 |
24 |
15 |
20 |
5 |
19 |
19 |
18 |
18 |
16 |
16 |
15 |
16 |
20 |
12 |
18 |
18 |
25 |
11 |
20 |
14 |
6 |
17 |
9 |
17 |
9 |
12 |
10 |
11 |
17 |
12 |
17 |
16 |
13 |
11 |
12 |
12 |
9 |
7 |
11 |
12 |
10 |
7 |
8 |
5 |
15 |
13 |
11 |
11 |
9 |
10 |
10 |
4 |
9 |
12 |
8 |
9 |
7 |
9 |
8 |
5 |
11 |
10 |
5 |
9 |
9 |
12 |
9 |
6 |
6 |
11 |
4 |
9 |
8 |
3 |
5 |
4 |
5 |
7 |
5 |
4 |
10 |
4 |
5 |
6 |
7 |
7 |
5 |
9 |
10 |
3 |
6 |
4 |
6 |
7 |
5 |
7 |
4 |
10 |
5 |
5 |
6 |
7 |
7 |
7 |
7 |
11 |
6 |
4 |
5 |
2 |
3 |
5 |
7 |
6 |
4 |
4 |
8 |
2 |
6 |
4 |
8 |
4 |
12 |
5 |
3 |
2 |
3 |
6 |
2 |
5 |
1 |
2 |
5 |
2 |
5 |
2 |
2 |
2 |
3 |
13 |
2 |
1 |
2 |
2 |
1 |
1 |
2 |
2 |
3 |
0 |
3 |
1 |
3 |
3 |
5 |
0 |
14 |
4 |
0 |
2 |
1 |
2 |
3 |
2 |
3 |
2 |
2 |
1 |
1 |
5 |
2 |
0 |
1 |
15 |
4 |
2 |
2 |
0 |
3 |
1 |
1 |
1 |
1 |
2 |
2 |
1 |
1 |
4 |
3 |
0 |
16 |
2 |
2 |
2 |
0 |
3 |
2 |
2 |
3 |
0 |
1 |
1 |
4 |
4 |
1 |
1 |
0 |
17 |
2 |
1 |
2 |
1 |
1 |
1 |
0 |
1 |
0 |
1 |
1 |
0 |
1 |
0 |
1 |
2 |
18 |
0 |
0 |
1 |
2 |
0 |
2 |
0 |
0 |
1 |
2 |
0 |
1 |
1 |
0 |
0 |
3 |
19 |
0 |
0 |
0 |
1 |
1 |
0 |
1 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
0 |
1 |
20 |
5 |
4 |
0 |
1 |
2 |
3 |
5 |
4 |
2 |
2 |
5 |
5 |
2 |
5 |
2 |
7 |
și peste
Tabelul 2. Frecvențe cumulate; primul rând arată la câte probe sunt calculate frecvențele.
Nr. |
200 |
400 |
600 |
800 |
1000 |
1200 |
1600 |
2000 |
2400 |
2800 |
3200 |
frecv. teoretice pt. |
1 |
55 |
101 |
139 |
188 |
222 |
276 |
351 |
428 |
506 |
575 |
658 |
672 |
2 |
22 |
51 |
73 |
109 |
142 |
174 |
237 |
303 |
359 |
432 |
510 |
531 |
3 |
20 |
53 |
84 |
115 |
150 |
174 |
231 |
276 |
325 |
385 |
426 |
419 |
4 |
16 |
35 |
62 |
83 |
108 |
127 |
172 |
217 |
263 |
301 |
336 |
331 |
5 |
19 |
38 |
56 |
74 |
90 |
106 |
137 |
169 |
205 |
241 |
275 |
262 |
6 |
17 |
26 |
43 |
52 |
64 |
74 |
102 |
131 |
160 |
183 |
204 |
206 |
7 |
11 |
23 |
33 |
40 |
48 |
53 |
81 |
103 |
122 |
136 |
157 |
163 |
8 |
9 |
16 |
25 |
33 |
38 |
49 |
64 |
82 |
103 |
115 |
130 |
129 |
9 |
8 |
11 |
16 |
20 |
25 |
32 |
41 |
55 |
66 |
80 |
94 |
102 |
10 |
3 |
9 |
13 |
19 |
26 |
31 |
42 |
57 |
68 |
82 |
96 |
81 |
11 |
6 |
10 |
15 |
17 |
20 |
25 |
38 |
46 |
56 |
66 |
78 |
64 |
12 |
5 |
8 |
10 |
13 |
19 |
21 |
27 |
34 |
41 |
45 |
50 |
50 |
13 |
2 |
3 |
5 |
7 |
8 |
9 |
13 |
16 |
20 |
26 |
31 |
40 |
14 |
4 |
4 |
6 |
7 |
9 |
12 |
17 |
21 |
23 |
30 |
31 |
31 |
15 |
4 |
6 |
8 |
8 |
11 |
12 |
14 |
18 |
21 |
26 |
29 |
25 |
16 |
2 |
4 |
6 |
6 |
9 |
11 |
16 |
17 |
22 |
26 |
27 |
20 |
17 |
2 |
3 |
5 |
6 |
7 |
8 |
9 |
11 |
12 |
13 |
16 |
15 |
18 |
0 |
0 |
2 |
4 |
4 |
6 |
6 |
9 |
10 |
11 |
14 |
12 |
19 |
0 |
0 |
0 |
2 |
2 |
2 |
3 |
7 |
7 |
8 |
10 |
10 |
20 |
5 |
9 |
9 |
9 |
11 |
14 |
23 |
27 |
37 |
44 |
53 |
49 |
și peste
Notând
frecvențele
relative cumulate (la n probe) ca timpul de așteptare să fie exact i,
atunci este clar că
este un
estimator pentru p = probabilitatea apariției unui 6. Iată evoluția acestei
frecvențe relative pentru n dat în tabelul 2 (adică n = 200, 400,
,3200):
.275, .252, .232, .235, .222, .230, .219, .214, .211, .205, .2056.
Am preferat
și nu
.205 deoarece frecvențele au fost toate deasupra lui .205; trebuie aleasă ca
probabilitate o frecvență în jurul căreia oscilează celelalte.
Calculând
testul a rezultat
un
calculat
de 14.7 care nu este suficient pentru a infirma ipoteza că
(la 19
grade de libertate câte avem, ar trebui un
mai mare decât 30.1 pentru a respinge ipoteza cu probabilitate de eroare mai mică decât 5%.
Dacă am fi ales
, abaterea
de la curba teoretică ar fi fost și mai mică (
=12.83)
dar am preferat
din motive
empirice: o valoare mai de mijloc a frecvenei relative este, probabil, mai
apropiată de adevărata probabilitate (!).
În figura
de pe pagina [134???] este arătată
evoluția frecvențelor relative cumulate după 400, 800, 1600 și 3200 de experimente. Am putea decide
de aici că modelul teoretic evenimente independente cu se potrivește
aproape perfect. Lucrurile nu stau chiar așa de simplu.
Am încercat să varific ipoteza independenței (de fapt, aici ar fi mai adecvată noțiunea lui Popper de falsificare). Din cele 16365 de aruncări cu zarul efectuate (pentru a obține 3200 de experimente) am reținut ultima serie de 3065 (din motive tehnice: numărătorile au fost făcute manual; altfel aș fi putut studia întreaga serie) pe care am studiat-o mai amănunțit. Am calculat frecvențele
,
,
pe care le-am trecut în tabelul 3.
TABELUL 3. Frecvențele și
1 |
2 |
3 |
4 |
5 |
6 |
||
1 |
117 -8 125 |
103 11 92 |
123 24 93 |
79 12 87 |
78 -16 94 |
118 -3 121 |
618 |
2 |
100 8 92 |
67 -11 68 |
82 9 73 |
54 -10 64 |
75 6 69 |
78 -12 90 |
456 |
3 |
97 -2 99 |
87 6 73 |
67 -12 79 |
67 -2 69 |
74 -1 75 |
101 4 97 |
493 |
4 |
80 -7 87 |
53 -11 64 |
53 -16 69 |
74 14 60 |
71 6 65 |
99 8 91 |
430 |
5 |
101 7 94 |
70 1 69 |
75 0 75 |
67 2 65 |
78 7 71 |
74 -17 91 |
465 |
6 |
123 2 121 |
76 -14 90 |
93 -4 97 |
89 -2 91 |
89 -2 91 |
132 14 118 |
602 |
|
618 |
456 |
493 |
430 |
465 |
602 |
3064 (total) |
Să notăm și
(rotunjit
la parte întreagă). Atunci, dacă probele ar fi independente, ar trebui ca
aproximativ;
dacă în loc de frecvențe am fi lucrat cu probabilități, ar fi trebuit ca
???. În
colțul din dreapta jos al celulelor (i, j) am notat valoarea lui
, iar în
colțul din stânga jos, abaterea de la aceste valori semiteoretice,
.
Deși la o simplă inspectare a acestor valori s-ar părea că abaterile nu sunt prea mari, și că nu avem motive serioase să respingem ipoteza independenței, valoarea indicatorului
Valoarea
tabelată a aceluiași indicator pentru respingerea ipotezei la nivel de semnificație
5% și 30 grade de libertate ( : avem
36 de căsuțe și 5 legături independente între ele de tipul
) este
ceva mai mare 43.773, dar la nivel 10%
.
Înseamnă că ipoteza independenței trebuie respinsă (cu risc între 5% și 10% de a comite o eroare). Există o explicație intuitivă a faptului că aruncările nu au fost independente: la ultimele probe, nu mai amestecam zarul în mână, ci îl luam de pe masă și îl lăsam să se rostogolească din palmă în cădere liberă de la o înălțime de 10 15 centimetri. De aceea probabil că a apărut o dependență markoviană între aruncări.
Se știe
că numerele reprezintă
o estimare a probabilităților de trecere ale lanțului. În cazul de față
Se observă
că dependența markoviană este destul de slabă: doar cinci dintre numerele
se abat
de la
cu mai
mult de .05 (
,
,
și
). Este
de așteptat, deci, ca rezltatul comportării acestui lanț Markov să nu difere
prea mult de cazul în care variabilele
ar fi
independente și identic repartizate. Acest lucru ar explica de ce modelul inițial
s-a potrivit așa de bine.
În matricea din Tabelul 3, să considerăm că nu ne interesează decât dacă rezultatul aruncării a fost 6 sau non-6. Pe 6 să îl renotăm cu 1 (succes) și pe non-6 cu 0 (eșec). Atunci tabelul frecvențelor devine:
Tabelul 4. Același ca Tabelul 3, dar rezultatele 1, 2, 3, 4, 5, 6 se cumulează sub eticheta 0 iar 6 este renotat 1.
0 |
1 |
||
0 |
1992 14 1978 |
470 14 484 |
2462 |
1 |
470 -14 484 |
132 14 118 |
602 |
Total |
2462 |
602 |
3084 |
Convențiile
sunt aceleași ca în Tabelul 3: în stânga jos sunt abaterile de la valorile
care apar
în colțul din dreapta jos.
Acum
, adică
insuficient pentru a respinge ipoteza că probele sunt independente. Ori, în
cazul experimentului de așteptare efectuat nu interesează decât 6
și non-6, adică 0 și 1. De aceea ipoteza independenței a fost, totuși, adecvată.
Un interval
de încredere de nivel 95% pentru adevărata probabilitate a apariției feței 6
este . Atât
valorile .21 și .205 gasite prin metoda cealaltă, de la pag. 133 (
) sunt
acceptabile.
Să luăm
acum în considerație modelul markovian. Lucrurile nu se complică prea mult.
Considerăm că noile variabile aleatoare
și
în rest,
formează un lanț Markov omogen și staționar (adică
nu depinde
de n). Matricea de trecere
o estimăm
din Tabelul 4. Atunci
. Trebuie
să calculăm
. Din ipoteza
de staționaritate,
sau
,de unde
se scoate imediat
sau, în
cazul nostru
.
Introducem
acum variabila aleatoare T =
timpul de așteptare până la apariția succesului, . Un calcul
elementar (condiționări repetate) arată că
dacă
și
. La 3200
de probe, frecvențele apropiate vor fi:
T |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
f |
629 |
491 |
397 |
321 |
260 |
210 |
170 |
138 |
111 |
90 |
73 |
59 |
48 |
39 |
31 |
25 |
20 |
f (real) |
658 |
510 |
426 |
336 |
275 |
204 |
157 |
130 |
94 |
96 |
78 |
50 |
31 |
31 |
29 |
27 |
16 |
Care, în mod paradoxal, sunt mai proaste decât cele obținute prin modelul naiv i.i.d !