| Statistica | Articolo | ||||
| Per stampare le informazioni, scegliere Stampa dal menu File. | |||||
| 3. | Raccolta dei dati |
Le “materie prime” della statistica sono i dati numerici ottenuti dalla misurazione o dal conteggio degli elementi in studio. Naturalmente esistono criteri e precauzioni da seguire nella fase di raccolta dei dati, in modo che sia garantita la completezza e l’accuratezza delle informazioni che ne conseguiranno.
Il primo problema che si presenta allo statistico è dunque di stabilire quali e quanti dati raccogliere. Per eseguire un censimento demografico, o anche per contare il numero di collisioni al secondo tra le molecole di un gas, infatti, sarebbe necessaria una rilevazione completa, tuttavia nella maggior parte dei casi vi sono ragioni pratiche che impediscono di raccogliere dati riguardanti l’intera “popolazione”, ovvero l’insieme completo sul quale deve essere condotto lo studio statistico. Si presenta quindi il problema di determinare un campione “rappresentativo” di tutta la popolazione, in modo che dall’analisi di quest’ultimo si possano trarre conclusioni accettabili per insiemi più ampi.
Per dedurre una legge fisica, biologica o sociale, lo statistico può iniziare ad analizzare un determinato insieme di dati, e in seguito modificarlo in base ai risultati ottenuti. Ad esempio, nei primi studi sulla crescita delle popolazioni, le previsioni venivano condotte in base al confronto tra il numero di nascite e di morti in un dato periodo. Gli statistici, tuttavia, dovettero presto riconoscere che la crescita di una popolazione dipende dal numero delle nascite, a prescindere da quello delle morti, e in base a questa considerazione adeguarono il metodo di rilevazione dei dati, limitandosi a contare il numero di nascite annue su campioni di popolazione composti da 1000 individui ciascuno. Quando le previsioni ottenute con questo sistema si rivelarono sbagliate, si dovettero individuare altri fattori significativi che incidessero sulla crescita delle popolazioni.
Poiché il numero di nascite possibili dipende dal numero di donne piuttosto che dal numero generico di individui della popolazione, e poiché il periodo in cui le donne possono avere figli è limitato a una parte ridotta della vita, si passò perciò a raccogliere i dati del numero di nascite annue su campioni di 1000 donne in età feconda. Infatti l’eccesso del numero di nascite rispetto a quello dei decessi fornisce solo una stima approssimata della crescita di una popolazione nel passato; il numero di nascite, raccolto su un campione di 1000 persone, dà invece una stima della proporzione di crescita della popolazione nel periodo stesso; il numero di nascite preso su un campione di 1000 donne in età feconda, infine, permette di predire la futura crescita della popolazione.