C

Campionamento alla rinfusa, di materiali

Indica il campionamento di materiali che si trovano accumulati alla rinfusa. E', cioè, la popolazione alla rinfusa, non necessariamente il campione risultante. Tale tipo di campionamento è applicato a materiali stivati senza contenitori nelle navi o in magazzini (carbone, grano, tabacco etc.).


Campionamento a rete

E' una procedura per la rilevazione di popolazioni rare che consiste nella ricostruzione della popolazione chiedendo alle unità individuate di segnalare altre unità del loro intorno. Per esempio, ad una donna selezionata da una lista di donne che hanno avuto un aborto in un dato periodo si può chiedere di elencare altre donne della propria zona che hanno avuto la stessa esperienza. La tecnica permette sia di ricostruire una più ampia lista della popolazione, sia di valutare la qualità della lista disponibile.


Campionamento a valanga

Metodo di campionamento consistente nel selezionare casualmente n unità, a ciascuna delle quale viene chiesto di indicare altre k unità che appartengono alla stessa popolazione, per s stadi successivi. Il campionamento si dice a valanga perchè ad ogni stadio il campione coinvolge nuove unità. Un semplice schema di campionamento di questo tipo è il campionamento basato sulla tecnica dei "tre amici più prossimi", ossia sulla richiesta rivolta al campione di individui di decrivere la situazione dei tre amici più prossimi, soprattutto su temi delicati, per i quali è difficile ottenere risposte dirette.


Campionamento annidato

Termine pittoresco da taluni adottato in luogo di "campionamento su più stadi", dato che a ciascun livello le unità sono "annidate" in quelle di livello superiore selezionate.


Campionamento casuale semplice

E' il metodo di selezione di campioni casuali nel quale ogni membro della popolazione ha una uguale probabilità di selezione e le estrazioni successive sono indipendenti. Un metodo di formazione di tali campioni è il campionamento con reimmissione.


Campionamento complesso

Modo di indicare un campionamento svolto con procedure diverse da quella semplice. Tipicamente, il campionamento complesso riguarda la selezione da liste di sub-popolazioni ("campionamento stratificato"), la selezione da liste gerarchicamente strutturate ("campionamento su più stadi", "campionamento in più fasi"), la selezione da liste riferentesi alla stessa popolazione in diversi punti temporali ("campionamento ripetuto", "campionamento ruotato"), e altre forme di campionamento particolari.


Campionamento con reinserimento

Con reinserimento, o bernoulliano, è detto il criterio di selezione casuale di campioni nel quale, dopo ogni estrazione di unità, si reiserisce l'unità estratta nell'urna. L'estrazione con reinserimento si può effettuare anche con le "tavole dei numeri casuali". V. anche "selezione di campioni".


Campionamento da liste

Si dice "da liste" il campionamento nel quale le unità sono selezionate da una o più liste nelle quali sono elencate le unità della popolazione. Si giustappone al campionamento di aree, nel quale, invece, le unità sono identificate sul territorio, al momento della rilevazione.


Campionamento di aree

Si denomina di aree, o areale, o di areole, o aereolare, il campione formato individuando con criteri probabilistici le superfici entro, o sopra, o sotto le quali si intende osservare un fenomeno. La lista dalla quale si seleziona il campione di aree è composta da particelle del territorio sul quale si intende svolgere la rilevazione. Si adotta in alternativa al cosiddetto "campionamento da liste" per indagini su popolazione e aziende; è il modo ovvio per indagini ecologiche, per rilevazioni su animali selvatici, per talune indagini agricole e forestali. Si usa anche per il controllo di qualità dei dati rilevati presso campioni di cui è incerta la completezza e, in alternativa a quello da liste quando le liste non sono accurate o aggiornate.


Campionamento di punti

Metodo di individuazione casuale di punti su una mappa, o direttamente sul terreno, per sottoporli a rilevazione. Si usa, tra l'altro, per valutare la qualità dei suoli o per piantarvi dei sistemi di rilevazione di caratteristiche atmosferiche.


Campionamento di quote

Tipo di campionamento non probabilistico nel quale, a ciascun rilevatore, è assegnato un certo numero di individui, detto "quota", da rilevare, ma la scelta delle unità è lasciata alla sua soggettiva scelta. Normalmente, le quote sono precisate in termini di caratteristiche della popolazione, per esempio, sesso, età e condizione professionale. Il rilevatore può scegliere le unità da rilevare purché rispetti le quote assegnate. Spesso si aggiungono anche vincoli sui criteri di individuazione delle unità, come l'obbligo di seguire un certo percorso. Queste accortezze mirano a limitare la soggettività della scelta con questo tipo di campionamento.


Campionamento diretto

Termine impropriamente impiegato per indicare la rilevazione diretta delle unità di un campione o della popolazione.


Campionamento distorto

Si usa per definire un processo di campionamento che incorpora una componente d'errore sistematica, in giustapposizione ai piani di campionamento che generano solo l'errore casuale, che si compensa in media. Sono tendenzialmente, anche se non necessariamente, distorti i processi di campionamento non probabilistici, in particolare quelli fondati sul giudizio soggettivo di uno o pochi addetti alla ormazione del campione.


Campionamento doppio

Nel campionamento per il controllo industriale, si dice "doppio" il campione formato da due sottinsiemi di numerosità n1 e n2, di cui si esamina il primo e, sulla base delle risultanze, si decide se accettare o respingere il lotto, e si esamina il secondo solo se l'esame del primo campione è insifficiente per decidere. Il termine si usa anche nel "campionamento in più fasi" per denotare un campione selezionato in seconda battuta da un campione di più ampie dimensioni tratto dalla popolazione e insufficiente per informare sul fenomeno su cui si ricerca. Tipicamente, il primo campione sarà facile da ottenere e a basso costo, mentre il secondo richiederà maggiori risorse ma risultati più vicini a quelli cui si mira con l'indagine.


Campionamento estensivo

Espressione che indica un campionamento di unità, aree etc. che contengono un numero limitato di unità della popolazione o che sono osservate a larghi intervalli di tempo. In questo senso il campionamento estensivo si giustappone a quello intensivo. Quando l'azione descritta riguarda la rilevazione e non la selezione campionaria, è preferibile usare l'espressione rilevazione estensiva.


Campionamento indiretto

Termine impropriamente impiegato per indicare la rilevazione indiretta di informazioni assumendole da documenti, registri etc., invece che direttamente dalle unità cui le informazioni si riferiscono.

Campionamento in più fasi

Campionamento effettuato selezionando nella prima fase dalla popolazione, nella seconda e nelle successive campioni di dimensione sempre più ridotta. Si applica quando il campione ottenuto nelle prime fasi è praticamente ed economicamente conveniente e può dare informazioni suppletive non altrimenti disponibili per la stratificazione e per l'adozione di stimatori di tipo rapporto o regressione. Non va confuso con il campionamento su più stadi. La forma più frequente di campionamento in più fasi è il cosiddetto "campionamento doppio", costituito cioè da due fasi, nella prima delle quali si trae un campione che viene esaminato e poi viene tratto da questo un campione di minori dimensioni basato anche sulle informazioni (per esempio, variabili di stratificazione) ottenute dal primo campione.

Campionamento intensivo

Si usa talvolta questa espressione per indicare il campionamento in una determinata area caratterizzata da una elevata densità di punti da campionare e anche il campionamento su un insieme ristretto di elementi che si esaminano a fondo. E' preferibile l'espressione "rilevazione intensiva".


Campionamento misto

Campionamento nel quale si possono intravedere due o più metodi di campionamento fondamentali. Per esempio, in due strati diversi, si possono selezionare le unità con due tecniche diverse, tra le altre, casuale semplice e sistematica. Il termine è poco usato e forse neppure consigliabile.

Campionamento non probabilistico

Non probabilistico, o "rappresentativo", è detto il campionamento di unità che non segue criteri probabilistici. Tra i più comuni campioni non probabilistici si individuano i campioni "a scelta ragionata" e i campioni "per quote", di uso frequente nelle indagini di mercato e nelle indagini non impegnate scientificamente. Rispetto a quelli probabilistici, i campioni non probabilistici presentano il duplice svantaggio di rendere incontrollabile il rischio di distorsioni nel processo di formazione dei dati e di non permettere la valutazione con metodi analitici dell'errore di stima. Un tipo di campionamento sicuramente distorto è quello detto "a casaccio", ossia la rilevazione svolta solo su unità che aderiscono volontariamente all'indagine.

Campionamento probabilistico

Probabilistico, o casuale, o statistico, è detto il campionamento nel quale, ad ogni unità della popolazione, è attribuita una probabilità positiva e nota di far parte del campione. Dal punto di vista operativo, tale procedura comporta l'utilizzazione in modo appropriato delle tecniche per la selezione casuale del campione. L'applicazione di queste tecniche è finalizzata all'ottenimento dell'indipendenza del campione da qualsiasi variabile interna o esterna all'indagine, compreso, in particolare, l'orientamento di colui che sta predisponendo il campione.

Campionamento rappresentativo

In senso esteso, qualsiasi campione tratto con intenti di rappresentare la popolazione è rappresentativo. Oggi il termine indica un tipo di campionamento non probabilistico nel quale le unità sono scelte con criterio di tipicità rispetto a certe caratteristiche, comunque scelte, della popolazione. Un campionamento rappresentativo in questo senso è quello formato individuando quote della popolazione. Questa accezione è contestata da coloro che vedono la rappresentatività determinata unicamente da criteri casuali di selezione. Se si parla di campioni rappresentativi, invece che di campionamento rappresentativo, ossia del risultato invece che delle intenzioni, il termine rappresentatività acquisisce il suo significato primario.

Campionamento ruotato

Si dice ruotato il disegno di campionamento per rilevazione in occasioni successive nel quale le unità campionarie sono parzialmente sovrapposte in due o più occasioni. Il disegno più elementare è quello in cui, a partire dalla seconda occasione, si sovrappone con la precedente occasione il 50% del campione. Il criterio di sovrapposizione tra occasioni e la possibilità per le unità di uscire dal campione per un certo numero di occasioni e poi rientrare qualificano questo disegno.

Campionamento senza reinserimento

Senza reinserimento, o in blocco, è detto il criterio di selezione casuale di campioni nel quale l'unità estratta non viene reinserita nell'urna. L'estrazione senza reinserimento si può effettuare anche con le "tavole dei numeri casuali". Si veda anche "selezione di campioni".

Campionamento simmetrico

Espressione desueta che denota la selezione equiprobabile di unità a fini di campionamento.

Campionamento sistematico

Selezione di campioni casuali effettuata mettendo in sequenza le unità da campionare e selezionandone una ogni tante, a partire da una selezionata casualmente. Il salto tra due unità selezionate si chiama "passo di campionamento". Il campionamento sistematico si può applicare sia ad una popolazione alle cui unità sono state assegnate le stesse probabilità di selezione, e in tal caso le unità campionarie hanno uguale probabilità n/N di inclusione, ovvero probabilità di selezione variabile, e in tal caso ogni unità ha probabilità di inclusione n pi, dove pi è la probabilità di selezione assegnata.

Campionamento stratificato

Campionamento svolto selezionando un campione da ciascuno strato. Nel ripartire il campione tra gli strati, si può adottare una delle seguenti tecniche (i) la cosiddetta "allocazione proporzionale", ossia la selezione di un'uguale proporzione da ciascuno strato, (i) l'allocazione "ottimale", o di Neyman-Tschuprow, nella quale la numerosità assegnata ad uno strato è funzione, oltre che del numero di unità appartenenti allo strato, anche della variabilità interna allo strato e al costo della rilevazione delle unità dello strato, (iii) altri criteri di ripartizione del campione finalizzati alla ottimizzazione del campione.

Campionamento su griglie

Caso particolare del "campionamento di aree", nel quale il territorio da sottoporre a rilevazione è suddiviso in areole di ampiezza e forma costante disposte secondo una regolarità geometrica. E' detto da taluni "campionamento di configurazioni".


Campionamento su linee

Su linee, o lungo linee, è detto il metodo di campionamento geografico consistente nel tracciare delle linee sull'area e nell'includere nel campione tutte le unità che cadono sulla linee o che le "intersecano". Se le linee sono parallele, il campionamento è assimilabile a quello sistematico. Se, invece, si prendono punti equispaziati sulle linee, il campionamento è simile ad una griglia e si può considerare un caso particolare del campionamento su più stadi.


Campionamento su più stadi

Campionamento realizzato selezionando per stadi, o livelli, le unità campionarie. Ad ogni stadio, le unità sono selezionate da unità campionarie di maggiori dimensioni selezionate allo stadio precedente. Per esempio, per formare un campione di famiglie, si può selezionare al primo stadio un campione di comuni e al secondo stadio un campione di famiglie traendole dalle liste anagrafiche dei comuni campione. Le unità selezionate al primo stadio si dicono "primarie", quelle del secondo "secondarie", etc.; le unità dell'ultimo stadio si dicono, talvolta, "finali". E' un tipo di campionamento che si applica, in particolare, quando non sono note le liste della popolazione da sottoporre a rilevazione. Per selezionare un campione dal secondo stadio in poi è, infatti, sufficiente conoscere le liste delle sole unità selezionate allo stadio immediatamente superiore.


Campionamento su strade

Su strade, o lungo strade, è detto il metodo di campionamento, in uso prevalentemente nelle rilevazioni agricole, svolto lungo strade di distretti agricoli. Si esplica rilevando, con riferimento al campionamento sistematico, le colture visibili dalle strade campione. Dato che è improbabile che le strade siano casuali, il campione risultante è tendenzialmente distorto, ma la rilevazione svolta percorrendo sempre le stesse vie può essere valida per rilevare le variazioni nelle colture.


Campione

Data una popolazione statistica composta da N unità, con N qualsiasi (anche infinito), si denomina campione l'insieme delle n unità selezionate fra le N che compongono la popolazione. Un campione può essere formato in base a logiche probabilistiche, e allora si dice probabilistico, oppure in base a criteri soggettivi di rappresentatività, e allora si dice non probabilistico. Le tecniche campionarie sono utilizzate per stimare statistiche della popolazione, ad esempio: medie, totali, rapporti fra variabili. Le stime ottenute in base a campioni di popolazione sono soggette all'errore campionario.


Campione a scelta ragionata

Campione costruito in modo da assomigliare, per alcune caratteristiche fondamentali (per esempio, in una indagine su popolazioni umane, per il sesso, l'età, la professione, etc.) alla popolazione statistica che si vuole rappresentare. Le informazioni sulla struttura della popolazione devono essere note a priori. Si tratta di metodi piuttosto arbitrari da impiegare soprattutto negli studi comparativi di situazioni tipiche non altrimenti rilevabili. Tra i tanti metodi di formazione di campioni a scelta ragionata, si annovera il "campione di unità tipiche". Questo è formato da unità tratte da certi strati o sottocampioni relativamente omogenei per alcune caratteristiche fondamentali di classificazione. La tecnica si basa sulla logica che le variabili afferenti ad un'unità statistica sono interdipendenti e che, se una unità è vicina alla media della popolazione per una variabile, in generale differirà di poco dalla media della popolazione anche per diverse altre.

Campione autoponderante

Campione le cui unità hanno uguale probabilità di appartenervi. L'autoponderazione del campione permette di realizzare stime corrette operando nel modo più semplice, ossia come se la rilevazione fosse esaustiva. Il campione può non essere autoponderante: (a) quando le unità sono state selezionate con probabilità diseguali; (b) quando la copertura di un eventuale campione autoponderante è incompleta. Nel caso di mancata autoponderazione, per ottenere stime corrette, si dovrà assegnare ad ogni unità statistica un peso variabile e proporzionale all'inverso della probabilità di appartenere al campione, in modo da far pesare di più nella stima le unità con probabilità più basse e, viceversa, da ridurre il peso delle unità selezionate con probabilità elevate.

Campione corretto

Campione ottenuto con un metodo corretto, ossia privo di distorsione. La distorsione può verificarsi sia nel processo di selezione delle unità, sia nelle procedure di formazione delle liste e di contatto delle unità. Secondo alcuni studiosi, la correttezza del campionamento si valuta anche rispetto alla prassi di rilevazione adottata e ai problemi incontrati nell'espletamento della rilevazione. Per non ingenerare confusione, conviene restringere il significato dell'espressione alla formazione del campione.

Campione di linee (v. Campionamento su linee)


Campione distorto

Campione ottenuto con un piano di campionamento distorto. Si veda anche "campione corretto".

Campione fisso

Nelle indagini ripetute nel tempo, si dice fisso il campione che viene osservato ripetutamente invece di selezionare nuovi campioni ad ogni occasione. Il campione fisso è spesso denotato con il termine inglese panel.

Campione per quote

Per quote, o di quote, è detto il campione non probabilistico per la cui formazione vengono fissati a priori solo la dimensione totale del campione in alcuni strati significativi e il numero di unità da assegnare ad ogni rilevatore. La scelta delle unità campionarie è lasciata all'iniziativa degli intervistatori sotto la condizione che rispettino le quote di popolazione che presentano le caratteristiche di strato prefissate. Le quote per strato vengono determinate in base alla conoscenza della distribuzione marginale o congiunta di alcuni caratteri legati alle variabili che si studiano nella popolazione o nelle sottopopolazioni in cui la stessa è stata preventivamente suddivisa. Per introdurre una forma di controllo sulla selezione del campione, si può fare in modo che gli intervistatori seguano particolari percorsi, oppure che intervistino il tipo di persone designate nel luogo in cui svolgono la loro attività.


Campioni abbinati

Coppia, o insieme di ordinalità superiore, di campioni i cui elementi sono stati abbinati sulla base di una o più variabili diverse da quella oggetto d'indagine. Lo scopo dell'abbinamento è la rimozione di possibili effetti confondenti delle relazioni tra variabili non-abbinate e la variabile o le variabili criterio dell'analisi.

Campioni equivalenti

Equivalenti dal punto di vista statistico sono i campioni selezionati con lo stesso schema di campionamento e di pari numerosità, dai quali, in forza della casualità della selezione, ci si aspetta la stessa informazione sui parametri in esame.


Campioni compenetrati

Compenetrati, o compenetranti, si dicono i (sub)campioni selezionati dalla stessa popolazione con lo stesso processo di selezione. La formazione di campioni compenetrati permette di valutare le differenze tra campione e campione come attribuibili al caso e, quindi, permette di stimare le componenti di variabilità delle stime anche quando non sia nota la distribuzione dello stimatore. La tecnica dei campioni compenetranti, mediante assegnazione casuale di un sub-campione ad ogni addetto, si applica a fini di stima della varianza del rilevatore, del supervisore, del codificatore.


Campioni duplicati

Campioni formati da unità comuni. Normalmente, queste unità comuni sono rilevate da diversi rilevatori, o codificate da diversi codificatori, o memorizzate da diversi addetti alla memorizzazione, per valutare la coerenza tra gli esiti della stessa azione (rilevazione, codifica, memorizzazione) svolta da diversi addetti.


Campioni ripetuti

Campioni formati per la seconda o per successive volte per assegnarlo a unità diverse di rilevazione, codifica, digitazione, analisi. Un caso particolare di campioni ripetuti sono quelli "compenetrati", ossia selezionati casualmente dalla stessa popolazione e poi attribuiti ad unità diverse al fine di valutare le differenze tra i valori medi delle osservazioni ottenuti da queste unità.

Campo di osservazione

Ambito della rilevazione definito dal "caso statistico", ossia dalla categoria di enti che hanno lo stesso nome ("nome comune"). Gli enti rientranti nel campo e sottoposti a rilevazione si chiamano unità statistiche. Da esse si distinguono le unità di rilevazione, strumenti prescelti per effettuarla nel modo più soddisfacente. Unità statistiche sono, ad esempio, i censiti, unità di rilevazione le famiglie di censimento, le convivenze, gli individui singoli nei casi speciali, o altro.

Campo di variazione

Differenza tra il massimo e il minimo valore della distribuzione di una variabile quantitativa. Il campo di variazione è una misura grezza di variabilità che, nel campionamento ripetuto, può essere assunta per stimare lo scarto quadratico medio della popolazione.


CAPI – Computer Assisted Personal Interviewing

Acronimo che indica il sistema di rilevazione assistito da computer, basato sulla tecnica dell'intervista faccia-a-faccia. Il sistema consiste nella utilizzazione di micro-computer portati dai rilevatori presso le abitazioni dei rispondenti. Sul computer è reso disponibile il questionario informatizzato e un programma di acquisizione delle informazioni digitate a seguito delle risposte ottenute dai rispondenti.

Cartogramma

Diagramma che rappresenta informazioni statistiche di tipo descrittivo mediante simboli, tratteggi o colori diversi, o mappe. E' una tecnica di rappresentazione grafica che si presta in modo particolare per rappresentare distribuzioni geografiche.


CASI – Computer Assisted Self-administered Interviewing

Acronimo che indica il sistema di rilevazione assistito da computer basato sul questionario da autocompilare assistito dal computer. Consiste nel rendere disponibile al rispondente un computer sul quale è attivo un programma che attiva le domande e memorizza le risposte. L'interpellato sente le domande per cuffia (si parla allora di Audio-CASI) e le legge dallo schermo del computer (Video-CASI) e risponde digitando le risposte sulla tastiera del computer.

Caso statistico

Risultato di un'operazione mediante la quale si realizza una visione schematica della realtà, orientata da obiettivi specifici di conoscenza ed operativi. Ogni entità potenzialmente destinata a costituire una unità statistica è considerabile nell'insieme dei caratteri che la contraddistinguono: il caso statistico nasce da una visione semplificata, la quale isola i caratteri interessanti per il particolare obiettivo, e quindi meritevoli di attenzione, da altri ritenuti irrilevanti e quindi trascurati. La formazione del caso si completa con una specificazione, per ciascun carattere, dell'elenco esaustivo di modalità mutuamente escludentisi che possono presentarsi nell'unità statistica e sollecitare attenzione mirata. La formazione del caso è un momento creativo, un'astrazione che precede la rilevazione di cui costituisce l'essenziale punto di partenza. Un modello di rilevazione ne costituisce la visibile espressione linguistica.


Categoria

Modalità di una variabile nominale.

Catena

Nell'analisi delle serie temporali di indici, indica la sequenza di elementi nella quale ogni elemento dipende, in un modo definito, dal precedente. Nella costruzione di serie di indici dei prezzi, è il metodo per la costruzione di indici concatenati.

CATI – Computer Assisted Telephone Interviewing

Acronimo che indica il sistema di rilevazione assistito da computer basato sull'intervista per via telefonica. I sistemi CATI, che oggi hanno quasi ovunque sostituito le rilevazioni telefoniche con "carta e penna", sono costituiti da un programma informatico che gestisce il questionario e, nei sistemi più evoluti, anche l'intero processo di rilevazione e di elaborazione statistica dei dati. L'intervista si svolge con l'intervistatore che, avendo di fronte il computer, colloquia con il rispondente e registra immediatamente le risposte. Il sistema è in grado di effettuare un controllo automatico delle risposte e di segnalare eventuali incoerenze tra risposte date in precedenza, nonché di scegliere il percorso di questionario adeguato per le caratteristiche del rispondente. Per esempio, se la persona si è dichiarata occupata, appariranno sullo schermo solo le domande pertinenti e non, tra le altre, le domande sui modi in cui cerca occupazione. I sistemi CATI possono essere centralizzati, e allora si può anche esercitare un'attività di supervisione in tempo reale del lavoro svolto, o locali, ossia utilizzati presso l'abitazione del rilevatore.

Censimento

Rilevazione svolta al fine di accertare la consistenza numerica, le principali caratteristiche strutturali e la distribuzione territoriale delle unità di una popolazione statistica. Il censimento è una rilevazione diretta, individuale, nel senso che ogni unità rispondente viene enumerata separatamente con tutte le caratteristiche, previste dal piano di rilevazione, trasversale, ossia riferita ad un preciso istante, con periodicità definita, solitamente decennale. Il censimento è l'esempio più classico di rilevazione totale, che prende cioè in considerazione tutte le unità del collettivo di riferimento, tanto che l'espressione "censimento incompleto" è usato da taluni per indicare l'insuccesso nella rilevazione di tutte le unità della popolazione

Censimento per campione

Indagine campionaria svolta a fini di censimento. Siccome i censimenti richiedono l'impiego di risorse umane, materiali e finanziarie notevoli e la qualità dei dati rilevati è spesso problematica, si è discusso e si discute, anche in Italia, sull'opportunità di svolgere rilevazioni alternative ai censimenti. In alcuni Paesi dell'Europa settentrionale, sono stati eseguiti censimenti per campione abbinando registri di popolazione e rilevazioni a rotazione della popolazione nel corso di un decennio (v. Censimento). In Germania, dove è stato svolto un censimento su base campionaria, è stato denominato Mikrozensus.

Ciclo

In senso stretto, è un movimento periodico in una serie temporale. Si usa talvolta anche per denotare andamenti alti e bassi, non necessariamente periodici, di una rappresentazione in serie; per denominare questa situazione conviene usare il più generico termine "oscillazione".

Classe

Modalità di una distribuzione di frequenze. Un gruppo di osservazioni su una variabile quantitativa, anche continua, può essere raggruppato in modo da rendere le elaborazioni meno laboriose: il gruppo così formato definisce una classe. Gli estremi, inferiore e superiore, dell'intervallo della variabile della classe sono detti "limiti", o "estremi di classe", l'intervallo compreso tra i detti limiti è detto "intervallo di classe", e la frequenza nell'intervallo è detta "frequenza di classe".

Classi aperte

Termine talvolta usato per definire le possibili realizzazioni di una "domanda a risposta aperta".


Classi chiuse

Modalità per la classificazione di unità osservate su una variabile di cui siano state definite tutte le possibili realizzazioni empiriche. Se la rilevazione avviene ponendo domande e attendendo risposte, si tratta di una "domanda a risposta chiusa".

Classificazione

Assegnazione di un insieme di unità alle classi di una o più variabili, le quali, per questo specifico obiettivo, si denominano anche fattori, o criteri, di classificazione. La classificazione si dice "ad una via" se l'assegnazione è svolta con riferimento alle k classi di una sola variabile, è "a due vie" se i fattori di classificazione sono due etc.

Codificazione, di informazione

Operazione mediante la quale vengono trasformati in numeri, in sequenze alfanumeriche, le informazioni espresse in forma verbale contenute in un questionario. L'operazione di codificazione, quando necessaria, precede quella di registrazione delle informazioni del questionario sul supporto informatico.

Coefficiente di affidabilità

Termine introdotto da Spearman per valutare la componente d'errore sistematico di un test psicologico da quella casuale. La misura dell'attendibilità del test è stimata con la correlazione tra due somministrazioni dello stesso test in contesti confrontabili.

Coefficiente di variazione

Rapporto tra lo scarto quadratico medio e la media di una distribuzione, talvolta espresso in percentuale.

Coerenza – Coerenti, dati

In senso lato, vi è coerenza tra dati statistici quando tra di essi non esiste contraddittorietà, o incompatibilità. Nell'indagine statistica, si parla di controllo di coerenza sia in rapporto al dato relativo alla singola unità, sia in rapporto ai risultati complessivi. La coerenza tra i dati non implica assenza di errore nei dati. Si distingue tra "coerenza interna" ad insiemi di dati e "coerenza esterna" tra risultati di indagini diverse.

Coerenza tra dati, analisi della

Vi è coerenza interna ad un insieme di statistici quando tra questi non esiste contraddittorietà. Nell'ambito della contabilità nazionale si parla di coerenza interna quando vi è coerenza tra stime legate tra loro da un vincolo contabile. La coerenza tra stime non implica assenza di errore nelle stesse.
Coerenza tra risultati di indagini diverse I risultati di indagini diverse sono coerenti se il raffronto tra stime di fenomeni tra loro collegati non sono contraddittori. La coerenza tra stime non implica assenza di errore nelle stesse.

Collegamento statistico

Operazione di abbinamento, con metodi probabilistici, di dati relativi ad unità provenienti da fonti diverse che si presentano complessivamente simili per le modalità di un insieme di caratteri.

Comparabilità – Comparabili, dati

Sono comparabili le statistiche internazionali sullo stesso fenomeno prodotte in base a norme uniformi e, se necessario, seguendo metodi armonizzati.

Completezza – Completa, rilevazione

Associato alle informazioni raccolte per le unità statistiche che partecipano all'indagine, indica l'assenza di dati mancanti nel questionario. Considerando il complesso dei dati raccolti nell'indagine, è detto "tasso di completezza" la quota o percentuale di unità per le quali siano state raccolte informazioni complete, sul totale delle unità che hanno partecipato all'indagine

Concentrazione

Aspetto della variabilità che esprime l'entità della concentrazione in poche unità di una grandezza "trasferibile" tra unità ed unità. Per esempio, si dice che il reddito di un Paese è più o meno concentrato secondo che la proporzione di reddito totale del Paese sia posseduto da poche persone o sia ben redistribuito. Il livello minimo di concentrazione è quello della equi-ripartizione della grandezza, ossia la sua invarianza tra unità ed unità.

Conciliazione di dati discordi

Qualora in una indagine di controllo si ottenga un dato diverso da quello ottenuto nella rilevazione principale, e la discrepanza sia resa immediatamente nota al rilevatore che sta eseguendo l'indagine di controllo, egli può, dopo un breve contraddittorio con il rispondente (se e quando ciò sia tecnicamente plausibile), conciliare le risposte avute ottenendo un dato per lo meno non-incoerente. La conciliazione delle risposte permette di disporre di due dati supplementari per ogni rispondente all'indagine di controllo, un primo dato utilizzabile per stimare la fluttuazione delle risposte imputabile al rispondente, un secondo per stimare la distorsione della stima, ossia lo scarto tra il parametro e il valore di stima ottenuto con la rilevazione principale. Il dato conciliato è, infatti, plausibilmente, il valore che più si avvicina al valore vero tra quelli rilevati.

Confidenzialità

Traduzione impropria dell'inglese confidentiality; il termine più appropriato è "riservatezza".

Conformità

Termine talvolta usato per esprimere la concordanza tra i risultati sperimentali e quelli attesi in qualche precisata ipotesi. Con riferimento a due classificazioni, la conformità implica l'uguaglianza delle voci ad almeno un livello gerarchico dell'articolazione delle voci stesse.

Connessione

In statistica, termine generale per "dipendenza" tra variabili. Si usa talvolta distinguere tra connessione "concreta", ossia empirica, e connessione "limite", ossia inerente alle popolazioni o ad insiemi infiniti. Nell'ambito di varie discipline, il termine evoca il concetto di "rete". In una rete elettrica, una connessione è un circuito costituito da un certo numero di elementi fra loro collegati. Il concetto può essere esteso anche all'organizzazione logistica di sistemi.

Consistenza – Consistente, stimatore

Consistente è lo stimatore che converge in probabilità, all'aumentare della dimensione campionaria, al parametro estimando.

Continuità- Continua, variabile

Un parametro o una variabile sono continui se possono assumere qualsiasi valore in un intervallo continuo. Una distribuzione di frequenze o probabilità è talvolta detta continua sia se è relativa ad una variabile continua, sia se è essa stessa continua. Per chiarezza, si dovrebbe parlare, secondo i casi, di "distribuzione di variabile continua" e di "distribuzione continua di variabile".

Controllo di qualità

Analisi statistica di dati inerenti ad un processo ispettivo con l'obiettivo di controllare la qualità di un prodotto industriale prodotto in grandi numeri. Mira ad identificare ed eliminare variazioni sistematiche della qualità, o a ridurle entro limiti accettabili, ammettendo solo imperfezioni casuali. Un processo del tipo esposto si dice "sotto controllo". Da qualche tempo, i principi del controllo della qualità industriale sono applicati anche al controllo della qualità dei dati statistici.

Controllo di verosimiglianza

Controllo di qualità di un dato basato sulla determinazione della probabilità che un valore registrato sia accurato. La verosimiglianza è determinabile con vari criteri: (a) se della variabile è nota la distribuzione, si può determinare la probabilità che la stessa assuma il valore registrato o un valore più estremo: se questa probabilità è molto bassa, si può controllare manualmente la correttezza del valore, o considerarlo non verosimile a fini operativi; (b) anche se non è nota la distribuzione della variabile, ma questa ha un andamento regolare, un valore che si discosti dalla media di almeno 3-4 volte lo scarto quadratico medio, può essere considerato poco verosimile.

Convalida delle stime

E' l'operazione di conferma della qualità dei dati a cui si giunge dopo adeguati controlli. In senso strettamente statistico, la convalida si ha quando il dato è stato giudicato obiettivo, attendibile e trasparente, ma il concetto si può estendere anche all'adeguatezza dell'informazione rispetto agli obiettivi prefissi. In questo senso, il concetto di validità è affine a quello di coerenza interna tra i dati o tra le procedure seguite per ottenerli. Un dato provvisorio è diffondibile anche se, per ragioni di tempestività nella diffusione è stato assoggettato a forme di convalida incomplete. Definitivo è allora il dato per il quale è completo il processo di messa a punto. Si possono avere più convalide in tempi successivi, e quindi più aggiornamenti dei dati quando si ottenessero nuove informazioni ausiliarie o l'utenza chiedesse un affinamento delle stime. Quantunque il termine "convalida" sia esso stesso un neologismo di origine burocratica, che ha sostituito "convalidazione", oggi è più diffuso il termine "validazione", dall'inglese validation, per denotare lo stesso concetto.

Coorte

Insieme di unità statistiche che vivono la stessa esperienza (demografica, economica, sanitaria etc.) per la stessa durata. Per esempio, è una coorte l'insieme dei coniugati nello stesso anno, oppure l'insieme delle persone esposte a radiazioni disperse per un incidente ad una centrale nucleare e osservate per un certo periodo a fini sanitari.

Copertura della rilevazione

In una indagine statistica il termine denota: (a) il rapporto esistente tra il numero di unità che hanno collaborato all'indagine e quelle designate a parteciparvi; (b) la frazione sottoposta a indagine, ma in questo senso è preferibile la locuzione "frazione di campionamento". Nel Programma Statistico Nazionale, nel quale si attribuisce al termine il significato descritto al punto (a), si distingue tra copertura: ÿ totale, quando l'insieme delle unità rilevate coincide con quello delle unità statistiche, ÿ parziale, quando le unità rilevate sono un sottoinsieme ben delimitato dell'universo delle unità statistiche, ÿ campionario, quando le unità rilevate sono una parte dell'universo delle unità statistiche scelte a caso con metodi probabilistici o scelte in maniera ragionata.

Copertura degli obiettivi d'indagine

Corrispondenza tra gli obiettivi realizzati nell'indagine e gli obiettivi prefissi. Si tratta di quell'aspetto della qualità dei dati denominato anche "pertinenza".

Correlazione

In una accezione generale, indica l'interdipendenza tra due variabili, sia qualitative che quantitative, e in questo senso include anche l'associazione tra variabili dicotomiche e nominali. In una – più comune – accezione ristretta, la correlazione indica la interrelazione tra due variabili quantitative o ordinali. Nell'analisi della dipendenza, il concetto di correlazione è sinonimo di covariazione, ossia è di correlazione o covariazione la relazione tra due variabili che variano simultaneamente, o nella stessa direzione ("correlazione positiva"), o in direzioni opposte ("correlazione negativa"). Il concetto di correlazione è immediatamente estendibile a più di due variabili.

Correlazione illusoria

Correlazione significativa alla quale non corrisponde una connessione causale tra le variabili. Per esempio, in Europa, si può trovare una relazione positiva tra l'abilità nel pattinaggio e il colore chiaro dei capelli, dato che le due variabili sono ambedue frequenti nei paesi nordici e ambedue assenti in quelli meridionali. La probabilità di trovare correlazioni illusorie è elevata quando si misura la correlazione tra serie storiche.

Correlazione interclasse

Correlazione ordinariamente intesa. Si usa talvolta il termine per distinguerla dalla correlazione intraclasse.

Correlazione intraclasse

Correlazione che esiste tra i membri di una entità statistica. Per esempio, la relazione intra-familiare tra le stature dei discendenti adulti si valuta confrontando, famiglia per famiglia, le stature dei membri adulti in rapporto alla statura media dell'insieme delle famiglie. All'interno di una famiglia di k individui, si confronteranno le k(k-1)/2 coppie di differenze tra le stature degli individui e la statura media degli individui dell'insieme delle famiglie: si ha correlazione intraclasse se le coppie di stature formate sono tendenzialmente sopra la media o tendenzialmente sotto la media.

Correlazione seriale

Correlazione tra le realizzazioni di una serie temporale o spaziale e le realizzazioni che precedono o seguono ad una distanza temporale o spaziale fissa. Data una serie, si dice correlazione seriale di ordine k la correlazione tra le coppie di realizzazioni a distanza k. In questo senso, la correlazione seriale è il valore campionario dell'autocorrelazione nella popolazione. Alcuni autori usano il termine autocorrelazione per denotare la correlazione tra i membri di una serie tra loro, sia campionaria che nella popolazione, mentre la correlazione seriale denota la correlazione tra due serie differenti.

Correttezza – Corretto, dato, stimatore

Indica una misurazione non affetta da errore. In altri termini, un dato è corretto se il valore osservato coincide con il "valore vero". Nella teoria della stima, la correttezza è la proprietà per la quale il valore atteso dello stimatore coincide con quello del parametro stimato. Si tratta di una proprietà teorica, analiticamente dimostrabile per gli stimatori analitici. Per esempio, la media campionaria è stimatore corretto della media della popolazione, mentre la varianza campionaria non lo è, ma lo è la varianza tra i valori campionari che ha (n-1) al denominatore. Uno stimatore non corretto è detto "distorto".

Curva di frequenza

Rappresentazione grafica di una distribuzione di frequenze continua, nella quale l'ascissa è la variabile e l'ordinata è la frequenza. Si può concepire la curva di frequenza come la forma limite del poligono di frequenze al divergere del numero di osservazioni e per classi che diventano indefinitamente piccole.