D

Dato aggregato, macrodato

Valore che si ottiene per sintesi dei dati elementari. In realtà, non vi è distinzione precisa tra macro e micro-dato, esistendo piuttosto tra i due un continuum. Il consumo familiare pro-capite è un insieme di consumi individuali distinti e di altri indivisi. A sua volta, il macrodato può essere preso come dato di base per una distribuzione di dati a livello gerarchico superiore. Per esempio, con il consumo familiare pro-capite si può costruire una distribuzione di famiglie secondo il livello di consumo pro-capite. Analogamente, la dimensione demografica di un comune è una grandezza costruibile attraverso informazioni individuali sulla residenza o sulla presenza, ma con le dimensioni demografiche di in insieme di comuni si può costruire la distribuzione di comuni per dimensione demografica. Tra i dati aggregati diffusi dai Sistemi statistici, si evidenziano le "tabelle di frequenze" e le "tabella di intensità".


Dato definitivo

Dato diffuso dal produttore di statistiche quando egli ha completato il relativo piano di rilevazione su tutti gli elementi in gioco e i cui risultati sono stati sottoposti ad un processo di messa a punto che li qualificano come validi.


Dato elementare, individuale, microdato

Dato che si riferisce al singolo carattere osservato su ciascuna unità di analisi. Se l'unità di analisi è un aggregato di unità statistiche, come ad esempio una famiglia, il dato relativo al reddito familiare totale, o pro-capite, è da considerarsi elementare anche se risulta da una funzione di dati relativi ad unità di livello inferiore. Ciò evidenzia l'impossibilità di distinguere il dato elementare dal dato aggregato se non in rapporto all'unità statistica di riferimento.

Dato mancante

Dato elementare del quale non sia registrato il codice. Quando manchi il dato si possono adottare varie strategie: (a) se ne può ignorare la mancanza se questa è casuale e i dati disponibili sono congrui per la stima, (b) si può rimpiazzare con un codice probabile determinato con una delle tecniche per la "correzione degli errori", (c) si può calcolare la stima ignorando la mancanza del dato anche quando questa non sia casuale e correggere poi la stima con un metodo idoneo.

Decremento

Variazione negativa di una variabile quantitativa.

Demografia

Studio quantitativo delle popolazioni umane. Esistono definizioni più analitiche della demografia, in accordo ai settori, alcuni di nuovo sviluppo, degli studi demografici. La demografia, infatti, è stata uno dei primi campi di ricerca della statistica, prima ancora che questa disciplina fosse così denominata, e ha contribuito allo sviluppo sia della statistica cosiddetta descrittiva, sia di quella analitica. Oggi si parla anche di "demografia delle imprese" per indicare la descrizione dell'evoluzione quantitativa delle stesse, in analogia ai processi di nascite e morte umani.

Densità, di distribuzione

Frequenza relativa o probabilità sopra un punto di una variabile continua. Se si considera una distribuzione empirica in classi di frequenza, la densità di una classe è data dal rapporto tra la frequenza della classe e l'ampiezza dell'intervallo di base. Se la variabile è discreta, la densità si dice puntuale.

Deviazione standard

Traduzione letterale dell'inglese standard deviation che indica la radice quadrata della varianza. E' più corretto il termine "scarto quadratico medio".

Diagramma a barre

Rappresentazione grafica di frequenze o intensità mediante rettangoli di altezza proporzionale alla frequenza o all'intensità pertinente. Si possono rappresentare barre "composite", ossia suddivise in sezioni di lunghezza proporzionale alla dimensione relativa delle componenti in cui si ripartisce il fenomeno che la barra rappresenta. Di solito, per distinguere le componenti, si usano retinature di varia intensità o colore. Per rappresentare fenomeni che variano in aumento o in diminuzione, si possono rappresentare barre orientate in direzioni opposte, sopra e sotto la linea dello zero.

Diagramma circolare

Metodo diagrammatico di rappresentazione nel quale le parti che compongono un totale sono rappresentate da settori di un cerchio. Gli angoli dei settori sono proporzionali al peso della componente sul totale. I moderni programmi di calcolo automatico sono predisposti per evidenziare graficamente una o più parti di particolare interesse. E' anche detto "diagramma a torta".

Dicotomia

Ripartizione dei membri di una popolazione, o di un campione, in due gruppi. La definizione dei gruppi può basarsi su una variabile quantitativa o qualitativa, o addirittura sulle modalità congiunte di più variabili, anche se, generalmente, la variabile di classificazione è un attributo.

Dimensione di unità statistica

Nella teoria del campionamento, l'individuazione delle unità campionarie può avvenire assegnando probabilità variabili alle unità della popolazione. Molti disegni di campionamento fanno riferimento a probabilità di selezione proporzionali alla dimensione delle unità. La dimensione può essere quella demografica (numero di abitanti, numero di famiglie etc.), quella territoriale (superficie, SAU etc.), quella economica (fatturato, numero addetti etc.), o altro. Nel campionamento su due stadi, la dimensione delle unità primarie congrua per la selezione con probabilità variabili al primo stadio è il numero di unità secondarie in esse contenute.

Dipendenza

Legame tra variabili o tra unità statistiche che comporta, dal punto di vista statistico, la covariazione delle osservazioni realizzate sulle variabili o sulle unità. L'assenza di dipendenza si denomina "indipendenza".

Discrepanza

In senso esteso, è sinonimo di scarto. Nell'analisi della varianza, è talvolta usata per indicare la somma del quadrato degli scarti. Disegno di campionamento (v. Piano di campionamento)

Distorsione relativa

Distorsione rapportata al valore dell'estimando. Si esprime spesso in percentuale.

Distribuzione campionaria

Distribuzione di una statistica o di un insieme di statistiche in tutti i campioni che si possono formare con una dato schema di campionamento. In genere, associata allo schema di campionamento è una procedura di selezione delle unità della popolazione. L'espressione riguarda la distribuzione di una funzione di un numero fisso di n variabili indipendenti.

Distribuzione casuale

Termine poco idoneo come sinonimo di distribuzione di probabilità.

Distribuzione condizionata

Con riferimento ad una variabile, è la sub-distribuzione ottenuta di una distribuione di frequenze congiunta tenendo fissa una modalità di una variabile. Così, se fij è la frequenza relativa congiunta della distribuzione di X (X=x1, .., xi, .., xr) e Y (Y=y1, .., yj, ..., yc), dove r è il numero di modalità di X e c quello di Y, si dice distribuzione di Y condizionata xi la distribuzione delle frequenza di Y|xi = yi|i, .., yj|i, .., yc|i, dove la frequenza di yj|i, fj|i è data da fij/fi. Per esempio, se X è il sesso e Y l'età in classi di una popolazione, e fij denota la frequenza del sesso xi e della classe di età yj, la distribuzione delle età per i maschi è la distribuzione di frequenze, a somma 1, delle età in corrispondenza della riga X=maschi. Distribuzione di frequenze Modo di specificare come una popolazione o un campione si distribuiscono in rapporto alle modalità di una o più variabili. La distribuzione di frequenze inerente ad una sola variabile si dice "univariata", quella congiunta inerente a due variabili si dice "bivariata", quella inerente ad una molteplicità di variabili si dice "multivariata". La distribuzione concettuale di una variabile quantitativa è, di solito, specificata da una "funzione distributiva" (di frequenze).

Distribuzione di probabilità

Funzione che dà le probabilità del verificarsi di un valore x di una variabile casuale in ragione del valore di x. Se le variabili sono più d'una, dà la probabilità del verificarsi congiunto dei valori delle variabili considerate. Molti usano le espressioni "distribuzione di probabilità" per denotare la funzione di densità di una variabile continua e "distribuzione cumulativa di probabilità" per denotare la probabilità di verificarsi di valori fino, e compreso, il valore x.

Distribuzione marginale

In una distribuzione bivariata di frequenze, è la distribuzione (talvolta detta anche classificazione) univariata delle frequenze delle due variabili singolarmente considerate. Il concetto è applicabile anche al caso multivariato, con significato automaticamente estensibile.

Domanda a risposta aperta

Domanda nella quale non sono prefigurate le possibili modalità di risposta, ma si lascia al rispondente e all'eventuale rilevatore la scelta della risposta da registrare.

Domanda a risposta chiusa

Domanda nella quale sono specificate le alternative di risposta. Se alle modalità di risposta sono affiancati dei codici, le modalità di risposta si dicono precodificate.