Esercizio n.1. Il problema ci propone tre insiemi A, B ed R che si
Short Description
Download Esercizio n.1. Il problema ci propone tre insiemi A, B ed R che si...
Description
Esercizio n.1. Il problema ci propone tre insiemi A, B ed R che si intersecano parzialmente e sono parte di un insieme U di 1200 soggetti sottoposti ad una analisi del sangue per determinarne il gruppo sanguigno di appartenenza. Tralasciando per comodità il segno di intersezione abbiamo: n(ABR) = 80, n(AB) = 240, n(AR) = 210, n(BR) = 120, per un totale di n(A )= 400, n(B) = 620, n(R) = 500. I rimanenti vengono considerati come appartenenti al gruppo 0 (zero). (AA̅)(BB̅) (RR̅) = (ABAB̅A̅BA̅B̅)(RR̅) = ABRABR̅AB̅RAB̅R̅A̅BRA̅BR̅A̅B̅RA̅B̅R̅ = U Essi costituiscono una partizione dell’insieme U. Per calcolare il numero di elementi di ciascun insieme (o evento) possiamo costruire un diagramma di Venn notando che: ABR = 80; ABR̅ = 160; AB̅R = 130; AB̅R̅ = 30; A̅BR= 40; A̅BR̅ = 340; A̅B̅R = 250; A̅B̅R̅ = 170. Considerando come evento l’appartenenza a ciascuno di questi insiemi possiamo costruire 8 eventi possibili con le loro probabilità: P{ABR} = 80/1200 = 0,6667 = p1 U 170 B P{ABR̅} = 160/1200 = 0,1333 = p2 P{AB̅R} = 130/1200 = 0,18033 = p3 A 340 P{AB̅R̅} = 30/1200 = 0,02500 = p4 160 8 P{A̅BR} = 40/1200 = 0,033333 = p5 40 80 P{A̅BR̅} = 340/1200 = 0,28333 = p6 30 1300 P{A̅B̅R} = 250/1200 = 0,20833 = p7 130 250 R P{A̅B̅R̅} = 170/1200 = 0,141667 = p8 Gli 8 eventi sono a due a due incompatibili e la loro somma è un evento certo. Con le loro probabilità PK formano una distribuzione di probabilità. Infatti : 30 0,6667+0,1333+0,18033+0,02500+0,03333+0,28333+0,20833+0,141667 = 1 R R p1 p2 p3 p4 p5 p6 p7 p8
Esercizio n.2 Completiamo la tabella data con i totali marginali: Voto\Scuola Scientifico
Altra scuola
Totale
Buono
42
12
54
Sufficiente
65
34
99
Totale
107
46
153
Dividendo ciascun valore per il totale generale otteniamo le frequenze relative che consideriamo come probabilità dei rispettivi eventi:
Voto\Scuola
Scientifico Sc
Altra scuola As
Totale
Buono Bu
0,275
0,078
0,353
Sufficiente Suf
0,425
0,222
0,647
Totale
0,699
0,301
1,000
Per determinare il coefficiente di correlazione tra le due caratteristiche (scuola media e voto in matematica) bisogna la probabilità condizionata che uno studente del liceo scientifico abbia ottenuto un voto buono e confrontarla con la probabilità di un buon voto tra tutti gli studenti. Per il teorema sulle probabilità condizionate abbiamo infatti la relazione P{BuSc} = P{Sc} P{Bu/Sc}, dalla quale si ricava: P{Bu/Sc} = P{BuSc}/P{Sc} = 0,275/0,699 = 0,393 Dividendo questo valore per la probabilità totale di ottenere un buon voto in Matematica si calcola il coefficiente di correlazione: ρ=
P{Bu / Sc} 0,393 = = 1.12 P{Bu } 0,353
Essendo questo valore maggiore di 1 si può ipotizzare che il voto in Matematica e il tipo di scuola media sono correlati. b) Nel problema sono intervenute tre distribuzioni di probabilità. Quella principale con 4 eventi BuSc, BuAs, SufSc, SufAs con probabilità rispettivamente di: 0,275, 0,078, 0,425 e 0,222. Le altre due sono le distribuzioni marginali di tipo bernoulliano con due eventi (Bu, Suf) e probabilità P{Bu} = 0,353 e P{Su} = 0,647. L'altra avrà anche due eventi (Sc, Al) con probabilità P{Sc} = 0,699 e P{As} = 0,301. Facoltativo. Verifichiamo l'ipotesi H0 che le due caratteristiche siano indipendenti. In questo caso avremo che il 50% degli studenti provenienti dallo scientifico (Sc)avranno ottenuto un buon voto, gli altri 50% sufficiente. Lo stesso per quelli di altre scuole (As) riassunto nella seguente tabella.
Voto\Scuola Scientifico
Altra scuola
Totale
Buono
53,5
23,5
77
Sufficiente
53,5
23,5
77
Totale
107
47
154
Confrontando le due tabelle con il test del 2si ottiene: 2 = (42 - 53,5)2/53,5 + (65-53,5)2/53,5 + (12-23,5)2/23,5 + (35-23,5)2/23,5 = 26,5 Essendo questo valore superiore al valore critico per un grado di libertà (nr - 1) (nc - 1) = 1 Dobbiamo rifiutare l'ipotesi che le due caratteristiche siano indipendenti e assumere quella alternativa che siano correlate. Esercizio n. 3 I valori della variabile aleatoria che segue una distribuzione normale di speranza matematica mu scarto quadratico medio s si ottengono dalla formula si ottengono mediante la formula che la definisce: z = (x - )/s. Pertanto z1 = (105 – 180)/24 = -3,125, z2 = (140 – 180)/24 = -1.667 e z3 = (200 – 180)/24 = 0,833. La probabilità che C sia minore di 105 si legge sulla tabella della funzione di ripartizione F(z). Tenendo conto che le tabelle presentano i valori della F(z) da zero in poi e quindi l'area sotto la curva normale da 0 all'infinito è uguale a 0,5, tenendo anche conto che la funzione densità di probabilità f(z) è simmetrica rispetto all'origine, i valori trovati sulle tabelle devono venir aumentati di 0,5 per i valori di z positivi, devono venir sottratti da 0,5 per i valori di z negativi. L'area sotto la curva normale da - a -3.15 sarà data da 0,5 il valore letto in tabella per z positivo. La probabilità cercata è data da P{C200}= 0,5-0,2967 =0,2033. Esercizio n. 4 L'intervallo di confidenza per la media di un campione di 100 elementi è dato dal valore critico di z per il livello di confidenza indicato, moltiplicato per lo scarto quadratico medio del campione e diviso per la radice quadrata del numero di elementi del campione. In simboli: s dove n=100, s = 25,7. E quindi se z90= 1,65; z95=1,96 e z99 =2 ,58 troviamo: zc n Al livello di confidenza del 90%: 166,5 1,65*25,8/10 = 166,5 4,257 Al livello di confidenza del 95%: 166,5 1,96*25,8/10 = 166,5 5,057 Al livello di confidenza del 99%: 166,5 2,58*25,8/10 = 166,5 6,656 Per trovare la numerosità del campione che assicuri un intervallo minore di 3mg/ml poniamo:
2
s s zc 3 da cui ricaviamo z c n dalla quale troviamo n = z c e di conseguenza: 3 n 3 per zc = 1,96 sarà n = 284; per zc=1,65 sarà n = 201 e per zc=2,58 si ottiene n = 492.
s
Esercizio n. 5 Poiché la probabilità che la patologia si presenti è molto piccola (0,0005) possiamo dire di trovarci di fronte ad eventi rari. Poiché, a quanto se ne sa gli eventi sino anche indipendenti possiamo pensare di applicare la distribuzione di Poisson con una media ipotetica che possiamo derivare dalla distribuzione binomiale: m = n*p = 40000*0,0005 = 20. m k e m Nella distribuzione di Poisson la probabilità di ottenere k successi è data da: pk = . k! Di conseguenza possiamo calcolare la probabilità di ottenere 0, 1, 2 successi: m 0 e m m1e m m 2 e m p0 = ; p1 = ; p2 = 0! 1! 2! Pertanto la probabilità di trovare più di due individui affetti da questa patologia sarà: P{k>2} = 1 – (p0 + p1 + p2).
View more...
Comments