![]() Scelti da Encarta
I migliori testi sull'argomento Statistica, scelti dalla redazione di Encarta Cerca in Encarta
Cerca in Encarta informazioni su Statistica |
Risultati di Windows Live® Search
Risultati di Windows Live® Search Pagina 2 di 2
Struttura articolo
Introduzione; Cenni storici; Raccolta dei dati; Tabulazione e presentazione dei dati; Analisi; Modelli matematici
Dopo aver raccolto e ordinato i dati, si procede alla fase di analisi, che consiste nel calcolo di alcuni parametri significativi, che esprimono in maniera sintetica le caratteristiche peculiari del campione esaminato.
L’analisi comincia con il calcolo del valore medio, un numero particolarmente significativo, che in un certo senso “rappresenta” o “riassume” tutti i valori assunti dalla variabile in esame. Il valore medio rappresenta un indice di posizione, e nella maggior parte dei casi tende a cadere centralmente, all’interno dell’insieme di dati, disposti in ordine crescente o decrescente. Supponiamo che x1, x2, …, xn siano i dati di una statistica. La misura significativa usata più spesso è la semplice media aritmetica, indicata dal simbolo , e data dalla somma dei singoli dati divisa per il loro numero, n:
Nell’espressione qui sopra il simbolo Σ indica l’operazione di somma di tutti i valori. Se i valori x sono raggruppati in k intervalli, in cui m1, m2 …, mk sono i punti medi e f1, f2, …, fk, le rispettive frequenze, la media aritmetica è data da
con i = 1, 2, …, k. Due diverse misure dell’indice di posizione sono la mediana e la moda. Per calcolare la mediana occorre dapprima riordinare gli n valori x in modo crescente o decrescente; se n è dispari, essa è il valore centrale di x; se n è pari, è la media dei due valori che separano gli n valori in due parti uguali. La moda invece è il valore di x che ricorre più frequentemente. Se due o più valori distinti di x ricorrono con la stessa frequenza, ma non ce n’è alcuno che abbia una frequenza maggiore, si può dire che l’insieme degli x non ammette moda, o equivalentemente che è bimodale, e le due mode sono allora i due valori di x più frequenti.
I dati raccolti possono mostrare la tendenza a raggrupparsi intorno a un solo valore, che in genere coincide con il valore medio, oppure possono essere “sparpagliati” su tutto l’intervallo dei valori possibili. L’indice di dispersione, o di variabilità, di una distribuzione di frequenze fornisce allora una indicazione di come sono distribuiti i dati, ovvero di quanto si discostano dal valore medio. Una possibile misura della dispersione intorno al valore medio consiste nella valutazione della differenza tra due dati percentili, solitamente il 25° e il 75° ( il p-esimo dato percentile è quel numero tale che il p % delle misure risulta minore o uguale a esso; in particolare, il 25° e il 75° dato percentile sono detti rispettivamente il dato quartile inferiore e superiore). Un’altra conveniente misura della variabilità di una distribuzione è la deviazione standard.
Due fenomeni di natura fisica, biologica o sociale sono positivamente correlati quando subiscono variazioni proporzionali e simultanee a causa del medesimo fattore esterno. Se uno dei due aumenta nella stessa proporzione in cui l’altro diminuisce, essi si dicono negativamente correlati. Il grado di correlazione si calcola applicando un opportuno coefficiente ai dati dei due fenomeni. Il coefficiente di correlazione più comune è dato da
in cui x è la deviazione di una variabile dalla sua media, y è la deviazione dell’altra variabile dalla sua media, e N è il numero totale di casi della serie. A una correlazione positiva perfetta tra le due variabili corrisponde un coefficiente +1; a una correlazione negativa perfetta corrisponde il coefficiente -1; mentre una totale assenza di correlazione è rappresentata dal coefficiente 0. Così, 0,89 indica un valore di alta correlazione positiva, -0,76 un’alta correlazione negativa, e 0,13 una bassa correlazione positiva.
Un modello matematico è un’idealizzazione matematica di un fenomeno fisico, biologico o sociale, che si traduce in un sistema, una proposizione, una formula o un’equazione matematica. Così, un dado ideale, perfettamente equilibrato, che possa essere lanciato in modo assolutamente casuale, rappresenta un modello matematico per un dado fisico reale. La probabilità che in un numero n di lanci di un dado ideale il numero 6 esca k volte è data dall’espressione
in cui (¥) è il simbolo di coefficiente binomiale e vale
Si può allora mettere alla prova la “bontà” di un dado reale lanciandolo più volte, e confrontando i risultati sperimentali con quelli del modello di dado ideale. Vedi anche Permutazioni e combinazioni. Come esempio di un modello matematico più complesso, si supponga di avere effettuato molte serie di misure: ad esempio, il numero di volte in cui si ottiene la cifra 6 in n lanci di un dado; il peso di N fagioli scelti a caso da un sacchetto; il valore della pressione barometrica ottenuto da studenti diversi con lo stesso barometro. In tutti questi casi, i valori osservati hanno distribuzioni di frequenze estremamente simili. Si può allora adottare un modello matematico che è un prototipo, o un’idealizzazione, di queste distribuzioni così simili tra loro. Se si assume che il numero di osservazioni, o di dati, sia molto grande, idealmente infinito, la funzione che rappresenta la distribuzione delle frequenze è
dove e è la base dei logaritmi naturali, e vale circa 2,7, mentre y rappresenta la frequenza del valore x. Il grafico di questa funzione (figura 4) è la curva a campana chiamata distribuzione di probabilità normale, o gaussiana.
Essa riveste un’enorme importanza nella statistica e nella teoria delle probabilità, dal momento che tutti gli eventi in cui intervengono fenomeni casuali si distribuiscono intorno al valore medio secondo tale curva.
© 1993-2008 Microsoft Corporation. Tutti i diritti riservati. |
© 2008 Microsoft
![]() ![]() |