S

Scala di misura, di variabile

Scala, o livello, di misura di una variabile statistica è l'insieme delle modalità impiegate per osservare una popolazione statistica. Le regole di trasformazione della caratteristica di un'unità nella modalità pertinente può cambiare in rilevazioni diverse. Per esempio, l'età di un individuo si può rilevare in anni compiuti, in classi quinquennali d'età, o altro. Se le modalità sono quantità, la variabile si dice "su scala quantitativa", o semplicemente "quantitativa", altrimenti la variabile è detta "qualitativa". Le scale di misura sono altresì catalogabili secondo le operazioni matematiche eseguibili con le modalità in: "nominali", se è possibile solo stabilire se due modalità sono uguali o diverse, "ordinali", se sono ammesse le relazioni di maggiore, uguale o minore, "ad intervalli", o "intervallo", se è sensato solo calcolare la differenza tra due modalità, e "a rapporti", o "rapporto", se è plausibile anche il calcolo del rapporto tra i valori di due modalità.

Scambiabilità – Scambiabili, variabili

In senso lato, sono scambiabili due entità di cui, in un dato processo, è possibile utilizzare una invece dell'altra. In senso stretto, le variabili casuali X1, X2,.., Xn sono scambiabili se tutte le loro n! permutazioni hanno la stessa distribuzione n-dimensionale. Un termine alternativo per scambiabili è "simmetricamente dipendenti".

Scarto quadratico medio

Radice quadrata della varianza. Nella presentazione di risultati è spesso preferito alla varianza perché è espresso nella stessa unità di misura dei valori osservati, e quindi, tra l'altro, delle medie delle osservazioni.

Scomposizione di una serie temporale

Individuazione delle componenti di una serie temporale mediante metodi statistici. Tipicamente, la scomposizione avviene individuando: (a) un movimento di lungo periodo, o trend, (b) una oscillazione di periodo e ampiezza più o meno regolari lungo il trend, (c) una componente stagionale, (d) una componente accidentale, o casuale. Non tutte le serie mostrano le tre componenti non accidentali, ma, quando sono presenti, si assume che siano additive. Un approccio più moderno, detto scomposizione di Wold (1938), o scomposizione predittiva, tenta di scomporre la serie in elementi deterministici e stocastici. Schema (v. Piano)

Selezione casuale

Metodo di formazione di campioni secondo il quale ogni possibile campione ha una probabilità di selezione fissa e determinata. La selezione si intende casuale se realizzata con una tecnica di generazione casuale di campioni, come tavole di numeri casuali, generatori di numeri casuali mediante computer, che garantiscono l'eliminazione della soggettività della selezione.

Serie e seriazione

In senso esteso, una serie è una successione di numeri che fanno riferimento ad una variabile statistica. In senso stretto, una serie è una successione di numeri che fanno riferimento ad una variabile qualitativa; in questo senso si contrappone a seriazione, che è invece una successione che fa riferimento ad una variabile quantitativa. Questa accezione è però peculiare della cultura statistica italiana. Serie di variabili qualitative si dicono ordinate o non ordinate secondo che presentino o no un ordine naturale nella successione. Una serie ordinata si dice "rettilinea" se presenta valori estremi all'inizio e alla fine, e "ciclica" se presenta oscillazioni. Una serie qualitativa non ordinabile si dice anche "sconnessa". Serie in senso stretto possono essere classificate anche rispetto al contenuto in serie temporali, o storiche, serie territoriali, o spaziali.

Serie temporale, storica

Insieme di osservazioni ordinate rispetto alla caratteristica quantitativa di un fenomeno individuale o collettivo osservato in punti temporali successivi. I punti temporali sono spesso presi ad intervalli costanti. I valori della serie si valutano in relazione al tempo.

Simmetria – Simmetrica, distribuzione

Distribuzione di frequenze (o di probabilità) nella quale le modalità ad uguale distanza dal centro della distribuzione hanno uguale frequenza (o densità). Il centro di una distribuzione simmetrica si dice asse di simmetria. In una distribuzione simmetrica la mediana e la media coincidono.

Sistema informativo

Insieme coordinato delle definizioni, delle classificazioni, delle procedure, degli strumenti, delle rilevazioni e degli indicatori mediante il quale si riesce a produrre e offrire informazioni in modi e tempi utili ai fruitori del sistema stesso. Le funzioni tipiche di un sistema informativo sono: (a) l'acquisizione di dati, (b) l'archiviazione di dati, (c) l'elaborazione dei dati, (d) la comunicazione e la diffusione del risultato delle elaborazioni.

Sistema informativo statistico

Sistema informativo in cui l'utilizzo delle informazioni mira a finalità prevalentemente statistiche-conoscitive. Si caratterizza per il trattamento di dati aggregati ("macrodati") e per la particolare attenzione dedicata ai "metadati" e alle "meta-informazioni".

Sistema Statistico Nazionale

Insieme di enti ed organismi pubblici di informazione statistica, avente il fine di rilevare, elaborare, analizzare, diffondere ed archiviare dati statistici. Fanno parte del Sistema, denotato anche con l'acronimo SISTAN: (a) l'Istituto Nazionale di Statistica (ISTAT), (b) gli Uffici di statistica centrali e periferici delle amministrazioni dello Stato e delle aziende autonome, (c) gli Uffici di statistica delle regioni, delle province autonome, delle province, di comuni singoli o associati, delle unità sanitarie locali, delle camere di commercio, industria, artigianato e agricoltura, (d) di altre ammnistrazioni ed enti pubblici che svolgano attività importanti per l'informazione statistica nazionale.

Sistematico

Aggettivo frequentemente usato in contrapposizione a casuale, o stocastico. Quindi, una variabile y composta da una costante c e da una componente x di media zero si dice che ha una componente sistematica c e una componente stocastica x. Analogamente, un errore si dice sistematico se ha media non nulla, e un disegno di campionamento si dice sistematico se non è casuale. La contrapposizione casuale-sistematico non è però sempre applicabile: tra l'altro, un evento casuale può avere esiti sistematici, si può ottenere un campione casuale (si dice quasi-casuale per distinguerlo) anche da strati determinati in modo sistematico.

Sostituzione

In una indagine statistica, è la selezione di una nuova unità per "sostituire" una che non collabora alla rilevazione al fine di ottenere la numerosità campionaria attesa. Il ricorso alle sostituzioni può generare distorsioni nelle stime e, se ammesso, va condotto sulla base di regole strettamente controllate.

Sottocampionamento

Sottocampionamento, o sub-campionamento, è il processo di selezione di un campione da un campione precedentemente formato. Si applica abitualmente al campionamento su più stadi, dove si formano campioni dentro ciascuna unità di livello superiore selezionata, al campionamento in più fasi, dove si formano campioni di dimensioni inferiori da campioni più ampi selezionati nelle prime fasi, alla compenetrazione di campioni, dove si usa formare più campioni da quello selezionato. Non è necessario che il sotto-campionamento segua le stesse regole del campionamento precedente.

Sottoclasse

Dominio di studio formato da sottopopolazioni che non sono state considerate nella stratificazione. Per esempio, sottoclassi possono essere la ripartizione per sesso e per età della popolazione anche se queste variabili non costituiscono strati espliciti.

Sottostima

Distorsione verso il basso di una stima.

Sovrastima

Distorsione verso l'alto di una stima.

Specializzazione, di statistiche

Con riferimento al prodotto statistico di indagini ed esperimenti, indica che l'uso possibile è ristretto agli obiettivi per i quali è prodotto. Questa caratteristica dei dati implica la necessità che nei programmi di attività si specifichino, oltre ai prodotti, i destinatari e le vie per la messa a disposizione dei dati stessi. 

 

Specificità – Specifico, di strumento di misura

Capacità di uno strumento di misura di discriminare le unità che possiedono un dato attributo da quelle che non lo possiedono. Si misura con la frazione di unità che, possedendo l'attributo, sono classificate correttamente, in rapporto alle unità nelle quali l'attributo è assente. I casi che, pur non possedendo l'attributo, sono classificati come portatori dello stesso, si dicono "falsi positivi".

Standardizzazione statistica

Data una variabile x di media µ e varianza s 2, si dice standardizzazione in senso statistico la trasformazione della variabile in z=(x-µ )/s 2. La variabile così trasformata, detta "misura standard", ha media 0 e varianza 1.

Statistica campionaria

Grandezza statistica funzione delle osservazioni di un campione (media, campo di variazione, varianza …) la cui distribuzione è determinata dall'insieme dei campioni che si potrebbero formare dalla popolazione utilizzando un dato schema di campionamento (dimensione campionaria, struttura del campione).

Statistica descrittiva

Metodo di analisi di dati statistici con finalità di descrizione di fenomeni, in contrapposizione con la statistica teorica, o inferenziale, che comporta processi di inferenza in probabilità per l'interpretazione dei risultati dell'analisi. La distinzione si può considerare utile in pratica, ma non del tutto logica (v. anche "Statistiche descrittive")

Statistiche descrittive

Dati statistici di sintesi di osservazioni ottenuti con l'intento di descrivere un determinato fenomeno. In questo senso, si giustappongono a statistiche analitiche, che mirano invece a studiare le relazioni tra fenomeni. Se si considera che la rappresentazione di una relazione altro non è che una descrizione, la distinzione non è interamente logica.

Stereogramma

Classe generale di diagrammi che mirano a rappresentare una figura tri-dimensionale sul piano. Il nome è dato, in particolare, alla forma a tre dimensioni dell'istogramma, con il quale si rappresenta una distribuzione bivariata di frequenze.

Stima

In senso stretto, è il particolare valore ottenuto dall'applicazione di uno stimatore in una indagine o in un esperimento statistico. Il termine è comunemente usato per indicare, in senso più ampio, anche l'insieme delle regole attraverso le quali è stato ottenuto quel particolare valore, ovverosia lo stimatore stesso. Si denomina stima anche l'operazione di inferenza, partendo dai dati campionari, del valore dell'estimando nella popolazione. La stima può riguardare un parametro, e in tal caso si parla di "stima puntuale", o un intervallo, e allora si parla di "stima intervallare".

Stima intervallare

Stima di un parametro della popolazione mediante specificazione di un intervallo, limitato inferiormente e superiormente, entro il quale si pensa che giaccia il vero valore del parametro. La stima dell'intervallo, usualmente detto intervallo di confidenza, si presume che contenga il vero valore con una certa frequenza nell'ottica del campionamento ripetuto, o con una certa probabilità se si specifica un'ottica probabilistica.

Stima puntuale

Stima del valore di un parametro della popolazione. Si giustappone a stima intervallare, nella quale si specifica un intervallo di valori. Considerato che la stima puntuale è contornata da una regione di valori, la distinzione tra i due metodi di stima tende a svanire sul piano interpretativo.

Stimatore

Regola o metodo ideato per stimare un parametro della popolazione statistica. E', di solito, espresso come una funzione dei valori campionari, ed è, quindi, una variabile statistica la cui distribuzione è di grande importanza nell'accertamento dell'attendibilità della stima che dallo stimatore deriva. Tra gli stimatori adottati nell'ambito delle statistiche ufficiali, prevalgono quelli detti lineari, ossia quelli basati su una combinazione lineare delle osservazioni campionarie. Sono stimatori lineari, la media campionaria, la proporzione campionaria, il totale campionario. Gli altri stimatori, detti non lineari, sono basati su trasformazioni non lineari delle osservazioni campionarie. Tra questi stimatori sono particolarmente interessanti lo stimatore basato sul quoziente tra due variabili casuali e lo stimatore basato sulla regressione tra due o più variabili casuali.

Stimatore basato su rapporto

Stimatore (non lineare) basato sul rapporto tra la variabile oggetto d'indagine e una variabile ausiliaria di media nota. Ciò implica che sia il numeratore che il denominatore siano soggetti ad errore campionario. Nella teoria del campionamento, se tutte le unità del campione possiedono due variabili x e y, la media di y può essere stimata moltiplicando il rapporto y/x per la media [Image]di x. Stimatore basato su regressione Stimatore (non lineare) basato sulla regressione tra la variabile oggetto d'indagine e una variabile ausiliaria, di media nota, correlata linearmente con questa. Nella teoria del campionamento, se tutte le unità del campione possiedono due variabili x e y, e si conosce il coefficiente di regressione tra y e x, by/x, l'equazione di regressione [Image]si assume come stimatore della media di y nella popolazione. Questo stimatore è più preciso di quello basato sulla sola media campionaria di y se x e y sono correlate.


Stimatore corretto

Stimatore che, per qualsiasi dimensione campionaria, ha un valore atteso uguale al parametro che si intende stimare. Se lo stimatore non è corretto si dice che è "distorto", ossia che lo scarto tra il valore atteso dello stimatore e il parametro stimato è diverso da zero.

Stimatore efficiente
Efficiente, o massimamente efficiente, è lo stimatore corretto la cui varianza campionaria è inferiore o tutt'al più uguale a quella di ogni altro stimatore dello stesso parametro (v. Efficienza). Se lo stimatore non è corretto, l'espressione si dovrebbe riferire all'errore quadratico medio, che ingloba anche la distorsione. Se lo stimatore è asintoticamente corretto, l'errore quadratico medio e la varianza coincidono asintoticamente, e lo stimatore è detto asintoticamente efficiente.


Stratificazione

Suddivisione della popolazione in sotto-popolazioni, dette strati. Di solito, la stratificazione si attua per trarre un campione dagli strati. La stratificazioni può basarsi su variabili territoriali o sulla base di altre caratteristiche della popolazione. Per esempio, le popolazioni umane si stratificano spesso per regione di residenza, sesso, età, grado di istruzione etc. La stratificazione può essere realizzata con un numero qualsiasi di variabili; se le variabili sono due o più si usa talvolta il termine "stratificazione multipla". Tra i tipi particolari di stratificazione si individuano: (a) la stratificazione "implicita", che si attua ordinando le unità della popolazione secondo una variabile di stratificazione almeno ordinale e selezionando le unità con un criterio sistematico; (b) la stratificazione "profonda", o "stratificazione dopo la selezione", che si attua selezionando campioni interi composti in modo da controllare più fattori di stratificazione di quelli possibili con la stratificazione di tipo convenzionale.

Strato

Qualsiasi partizione della popolazione. Nel campionamento, gli strati sono insiemi di unità utilizzati per la stima dei parametri della popolazione. Gli strati stessi possono essere insiemi per i quali si producono stime; in tal caso, si denominano "domini di studio".

Struttura del campione

Specificazione completa del disegno di campionamento. Riguarda il numero di stadi, l'eventuale stratificazione, il criterio di selezione delle unità, il tasso di sovrapposizione nelle eventuali occasioni successive di rilevazione etc.