LA STATISTICA NELLE SCIENZE SOCIALI
LA STATISTICA NELLE SCIENZE SOCIALI

La statistica è una metodologia che ha come scopo la conoscenza quantitativa dei fenomeni collettivi , ossia di quei fenomeni il cui studio richiede l’osservazione di un insieme di manifestazioni individuali . Le parole chiave sono : METODOLOGIA , CONOSCENZA QUANTITATIVA , FENOMENO COLLETTIVO ( semplici e complessi ) ,  OSSERVAZIONE ,                 MANIFESTAZIONE INDIVIDUALE . Lo strumento statistico risulta indispensabile per due categorie di scienze : Gli studi osservazionali           ( sociologia , comunicazione etc. ) e quelli sperimentali ( chimica , fisica etc.) . Dall’osservazione di un insieme di manifestazioni individuali del fenomeno collettivo oggetto di studio si ottengono i DATI STATISTICI . Essi sono il risultato dell’osservazione di una manifestazione individuale che informa sul modo ( MODALITA’ esaustiva ; non sovrapposta ) con cui si realizza una caratteristica specifica CARATTERE STATISTICO qualitativo     ( nominale e ordinale ) ; quantitativo ( a intervalli e Di rapporti ) del fenomeno in corrispondenza di una singola entità ( UNITA’ STATISTICA ) . Un insieme di unità statistiche omogenee costituisce una POPOLAZIONE STATISTICA ; essa può essere reale , teorica , finita , infinita . La trasformazione del livello di misura dei CARATTERI consiste nella introduzione di parametri e nella suddivisione in classi . La trasformazione del livello di misura delle UNITA’ STATISTICHE : Di rilevazione ( danno luogo ai MICRODATI ) e Di analisi (danno luogo ai MACRODATI). MICRODATI : Dati relativi a ciascun intervistato ; MACRODATI : Dati aggregati per sesso degli intervistati ; METADATI : Sono informazioni sul processo di produzione dei dati ( esatta individuazione delle FONTI ; ricostruzione della natura e del senso delle variabili disponibili ) . L’analisi primaria : Dati già rilevati , elaborati e diffusi da altri soggetti ; l’analisi secondaria : riguarda invece l’uso di dati già rilevati leggendoli sotto molteplici punti di vista , adottando approcci diversi da quelli originari avendo il vantaggio di evitare l’onere dei costi e dei tempi di raccolta e produzione . In questo contesto diventano indispensabili i METADATI .  L’individuazione delle fonti ovvero : LA MAPPA DELLE FONTI STATISTICHE: Le fonti statistiche sono enti e istituzioni create per la produzione di dati riguardanti i fenomeni collettivi considerati sotto l’aspetto quantitativo per scopi conoscitivi e/o amministrativi . Da qui si procede verso le analisi secondarie . Si attua una classificazione in base a due criteri : territoriale   ( nazionali ed estere ) e quello che distingue tra fonti ufficiali e fonti parallele . Per quanto riguarda il primo criterio : Fonti nazionali ( il SISTAN ovvero il sistema statistico nazionale ; Altre fonti ) e Fonti europee ( Il SSE ovvero il sistema statistico europeo ; Altre fonti internazionali quali OMS , UNESCO etc. ) . Il SISTAN è costituito da una rete di soggetti pubblici e privati nazionali migliaia di uffici a cui partecipano circa 60 istituzioni pubbliche e private che hanno il compito di fornire le statistiche ufficiali nazionali . Esso è regolato dal Dlg. 6/9/1989 , dalla legge 125 del 1998 e da una serie di altre norme ; ha il compito di fornire statistiche ufficiali , attua il Piano Statistico Nazionale ( PSN ) . Del SISTAN fanno parte : ISTAT , gli uffici di statistica centrali e periferici , gli uffici di statistica degli Uffici territoriali di governo , gli uffici di statistica di regioni , province , ASL , camere di commercio , industria , artigianato e agricoltura , alcuni Enti pubblici e privati . ISTAT : coordina il Sistema Statistico Nazionale , predispone il Programma Statistico Nazionale ( PSN ) , effettua censimenti ed altre indagini ufficiali , predispone nomenclature e metodologie ufficiali , diffonde i dati delle indagini effettuate , mantiene rapporti con enti statistici esteri ed internazionali . Il SISTAN è un sistema dinamico poiché la normativa prevede possibili modifiche nella sua composizione , esso è coordinato dall’ISTAT che si avvale in questo compito dell’ausilio del COMSTAT ( comitato di indirizzo e coordinamento dell’informazione statistica ) il quale è un organo collegiale che emana direttive e atti di indirizzo , esso è presieduto dal presidente dell’ISTAT . Il PSN ha come obiettivi i Programmi settoriali ( territorio , ambiente popolazione , servizi sociali ) , il Mercato del lavoro ( i vari settori economici ) etc. Altre fonti che producono dati sono : SIAE , CENSIS e EURISKO ; altre fonti che attuano il monitoraggio delle audience di determinati media sono : AUDITEL , AUDIRADIO , AUDIPRESS e AUDIWEB . Esiste poi il SIS ovvero il Sistema Informativo Sanitario del Ministero della Salute . Nato alla fine degli anni ottanta , ha subito modifiche e a partire dal 2002 è stato istituito il Nuovo Sistema Informativo Sanitario ( NSIS ) . Gli obiettivi principali sono il monitoraggio dei seguenti parametri : stato di salute della popolazione , efficacia ed efficienza del sistema sanitario considerando l’organizzazione della ASL e le varie assistenze sanitarie , residenziale , ospedaliera e farmaceutica . NSIS è caratterizzato dalla raccolta di dati analitici centrati sull’individuo che rivelano i singoli contatti con il SSN . Un aspetto principale del NSIS è il ( MRA ) ovvero il progetto Monitoraggio della Rete di Assistenza che prevede il censimento delle varie strutture di ricovero , pubbliche , private , accreditate e non . Il fulcro del NSIS è una progressiva raccolta delle informazioni sanitarie dell’individuo con l’obiettivo di realizzare il Fascicolo Sanitario Elettronico ( FSE ) . L’ISTAT elabora alcuni dati del NSIS e li diffonde sotto forma di indicatori nel database informativo territoriale : HEALTH FOR ALL . Il contenuto riguarda circa 4000 indicatori su diverse aree tematiche come ad esempio : Stili di vita , condizioni di salute , assistenza sanitaria , prevenzione e contraccezione , cause di morte . Le statistiche tratte dalle SDO ( schede di dimissione ospedaliera ) rappresentano una raccolta delle informazioni relative a ogni paziente dimesso dalle strutture ospedaliere . La SDO è una fonte di dati sanitari per fini epidemiologici . Esistono poi le indagini sulle interruzioni volontarie della gravidanza , sull’offerta di servizi sociosanitari , sulle condizioni di salute ( prevalenza patologie croniche , attività fisica , abitudine al fumo , prevenzione dei tumori femminili etc. ) , ricorso ai servizi sanitari e aspetti della vita quotidiana . Quest’ultimo si basa raccogliendo informazioni sulle condizioni di salute in generale attraverso i tre quesiti ( salute percepita ; malattie croniche ; limitazioni di attività a causa di problemi di salute ) del MEHM ( Minimum European Health Module ) . Le fonti statistiche europee : EUROSTAT . Esso svolge attività di raccolta e coordinamento della statistica comunitaria diffondendo le ricerche sul portale ec.europa.eu/ eurostat . Le statistiche europee sulla salute derivano da indagini effettuate dagli istituti di statistica nazionali ; sono di tipo amministrativo e conoscitivo . La principale fonte internazionale è l’OMS . Istituita nel 1948 è l’agenzia delle nazioni unite specializzata nelle questioni sanitarie . L’obiettivo dell’OMS è il raggiungimento da parte di tutte le popolazioni del livello più alto possibile di salute , definita come condizione di completo benessere fisico , mentale e sociale , e non soltanto come assenza di malattia o di infermità . 

POPOLAZIONE E CAMPIONE : Per popolazione si intende ogni insieme finito o infinito di N unità . Per campione si intende un insieme di n unità campionarie selezionate tra le N che compongono la popolazione , detta popolazione di riferimento . Il campionamento consente di risalire con sufficiente approssimazione alle caratteristiche complessive del fenomeno . Il campione serve per ottenere informazioni da un piccolo gruppo per poi generalizzare i risultati ad una popolazione . E’ necessario elaborare un piano di campionamento che costituisce una delle principali fasi di una indagine campionaria . La prima fase del campionamento consiste nel definire la popolazione . I metodi di campionamento : 1 ) probabilistico 2) non probabilistico . Nel primo caso le unità sono selezionate con meccanismo casuale e hanno tutte una probabilità e non nulla di essere selezionate ( def. Di Cochran ) . Nel secondo caso la scelta degli elementi della popolazione viene effettuata in base a criteri logici fissati a priori . Nel metodo di campionamento probabilistico abbiamo : Campione casuale semplice ( è un campione ottenuto attraverso una procedura in grado di assicurare che ogni possibile campione selezionabile dalla popolazione abbia un’identica probabilità di selezione , si usano tavole di numeri casuali ) , C. sistematico ( si usa quando è arduo numerare tutti gli elementi della popolazione ) , C. stratificato ( la popolazione è suddivisa in gruppi omogenei detti strati rispetto al carattere oggetto di studio ) , C. a grappolo ( gli individui sono suddivisi , in modo naturale od artificiale , in gruppi legati da vincoli di contiguità spaziale , tipo comuni , famiglie , scuole ) . Il campionamento a stadi è una combinazione degli altri metodi di campionamento probabilistico .  Nel metodo di campionamento non probabilistico abbiamo : Campione a scelta ragionata ( sono una fotografia del fenomeno basata sul punto di vista del ricercatore che permette di ottenere risultati attendibili per quegli aspetti che sono ben conosciuti e non per tutti gli altri aspetti ) , C. per quote ( si suddivide la popolazione oggetto di studio in strati secondo alcune variabili tipo il sesso , l’età , la condizione professionale ) , C. a valanga ( si effettua una selezione iniziale di un gruppo di unità dalle quali ottenere indirizzi e nominativi di altre unità appartenenti alla stessa popolazione ) , C. di convenienza ( la selezione delle unità è la facilità di accesso da parte di chi compie l’indagine ) . 

LA RAPPRESENTATIVITA’ DEL CAMPIONE : è la sua conformità ad alcune caratteristiche della popolazione.

UNIVERSO DEI CAMPIONI : è l’insieme dei campioni possibili di n unità che si possono estrarre da una popolazione attraverso una operazione di selezione .

ERRORE CAMPIONARIO : è l’errore che viene commesso quando viene impiegata una statistica campionaria per prevedere il valore di un parametro della popolazione .

DISTORSIONI : comportamento non neutrale del rilevatore , comportamento reticente da parte degli intervistati su determinati argomenti tabù .

CALCOLO DELLE PROBABILITA’ : studia le situazioni in cui interviene il caso e per questo l’esito è incerto . La probabilità ha tre impostazioni : 1 ) classica 2) frequentista 3) soggettiva .

DISTRIBUZIONE DI PROBABILITA’ :  è l’insieme dei possibili risultati e le corrispondenti probabilità di una variabile casuale X . La distribuzione normale o di Gauss è una distribuzione teorica di notevole interesse pratico per le sue proprietà matematiche utilizzabili nell’ambito dell’inferenza statistica . 

RILEVAZIONE CENSUARIA : Per indagine censuaria si intende una rilevazione di tutte le unità che presentano le caratteristiche che si vogliono studiare .

Dott. Filippo d’Alfonso

Bibliografia : 

Metodi statistici di base e avanzati per le scienze sociali ; aa. Alan Agresti , Barbara Finlay . A cura di Mariano Porcu . Ed. Pearson , anno 2020 .

Statistiche , istruzioni per l’uso ( fonti e strumenti per l’analisi dei dati ) collana 3s di statistica per le scienze sociali , anno 2012 . Ed. Nuova Cultura . Autori : Laura Bocci e Isabella Mingo .