Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

INTRODUZIONE E RACCOLTA DEI DATI STATISTICA, Appunti di Statistica

INTRODUZIONE E RACCOLTA DEI DATI, ORGANIZZAZIONE DEI DATI IN TABELLE, SINTESI E DESCRIZIONE DEI DATI QUANTITATIVI (misure di variabilità e di posizione)

Tipologia: Appunti

2012/2013

In vendita dal 25/09/2013

alessandroroma230886
alessandroroma230886 🇮🇹

4.7

(7)

62 documenti

1 / 4

Documenti correlati


Anteprima parziale del testo

Scarica INTRODUZIONE E RACCOLTA DEI DATI STATISTICA e più Appunti in PDF di Statistica solo su Docsity! INTRODUZIONE E RACCOLTA DEI DATI STATISTICA La statistica è un metodo di studio di caratteri variabili rilevabili sulla collettività secondo una certa scala di misura avente come scopo la sintesi delle informazioni disponibili e la loro estensione induttiva a casi più generali. Per capire questa definizione, si rendono necessarie alcune definizioni. - popolazione (o universo): è l’insieme degli elementi che si prendono in considerazione; - campione: è la porzione della popolazione che si seleziona per l’analisi; - parametro: è una misura di sintesi che descrive una caratteristica dell’intera popolazione. Il carattere (fenomeno) è un aspetto della realtà che si manifesta attraverso insiemi di realizzazioni e si manifesta ai nostri sensi. La variabilità è la possibilità che il carattere ha di manifestarsi in modi diversi e dipende anche dalla precisione degli strumenti di misurazioni. Un generico modo di presentarsi del carattere è detto modalità. I caratteri variabili (statistici) sono l’oggetto della statistica e assumono almeno due diverse modalità. Le possibili fonti di variabilità sono: - la variabilità sistematica; - la variabilità casuale. Le rilevazioni sono le operazioni di osservazione del dato corrispondente ad un elemento della popolazione e sono l’indicazione secondo una scala di misura della manifestazione del carattere osservato sull’unità. L’insieme delle unità statistiche è detto collettività, che può essere finita o infinita. Ogni singola unità, invece, si chiama carattere, che può essere: - qualitativo, se le modalità sono caratteri e che danno luogo a risposte qualitative, non numeriche, come si o no, maschio o femmina, ecc.; - quantitativo, se le modalità sono numeri e che danno luogo a risposte numeriche, come l’altezza. Il carattere qualitativo può a sua volta essere: - non ordinabile (o sconnesso); - ordinabile (mutabili). Il carattere quantitativo, invece, può a sua volta essere: - discreto, se le nostre osservazioni sono frutto del nostro conteggio (il numero delle riviste a cui si è abbonati); - continuo, se le nostre osservazioni sono frutto della nostra misurazione (la nostra altezza). I caratteri, inoltre, possono essere: - trasferibili (ad esempio il reddito); - non trasferibili (ad esempio la statura, il peso, ecc.). Un esempio di dato di stock è il capitale perché si riferisce ad una data precisa, mentre un esempio di dato di flusso è il reddito perché si riferisce ad un intervallo di tempo. L’indagine statistica è ben definita se fissati gli obiettivi si stabiliscono: - il/i carattere/i oggetto/i dello studio; - la scala di misurazione; - l’universo delle unità statistiche alle quali si vogliono estendere le conclusioni dello studio; - l’ampiezza del campione. L’indagine statistica può essere: - censuale; - campionaria. Il campione prescelto deve essere rappresentativo di tutta la popolazione e per questo la scelta degli elementi del campione deve essere casuale. L’inferenza statistica è una metodologia che consente di estendere i risultati ottenuti dallo studio di un campione all’intera popolazione. La teoria della stima consiste nello stimare un parametro della popolazione, ossia nel determinare degli stimatori “T” che possono fornire informazioni corrette su alcuni parametri della popolazione. La stima può essere di due tipi: - puntuale, che consiste nell’assegnare al parametro “θ” della popolazione un solo valore ottenuto dal campione associando a questo valore l’errore medio di campionamento che viene misura dallo scarto quadratico medio dello stimatore; - intervallare, che permette di determinare sulla base delle osservazioni campionarie un’intervallo detto fiduciario entro il quale si trova con una prefissata probabilità detta livello fiduciario (1- α). ORGANIZZAZIONE DEI DATI IN TABELLE TABELLE PER DATI QUANTITATIVI La distribuzione di frequenza Una distribuzione delle frequenze è una tabella in cui i dati sono organizzati in classi di raggruppamento o categorie. Per costruire una tabella bisogna: - scegliere il numero delle classi; - costruire gli intervalli di stessa ampiezza. L’ampiezza è data dal rapporto tra il range e il numero delle classi: “ampiezza intervallo=rango/n° classi”. La distribuzione delle frequenza relative e la distribuzione delle percentuali La distribuzione delle frequenze relative si ottiene riportando le frequenze assolute della distribuzione delle frequenze al numero delle osservazioni. La distribuzione delle percentuali si ottiene moltiplicando per 100 ciascuna frequenza relativa. La distribuzione cumulativa La distribuzione cumulativa si può ottenere sia dalle frequenze assoluto che da quelle relative: Ni=Ni-1+ni (dalle frequenze assolute) ; Ni=Fi+n (dalle frequenze relative). SINTESI E DESCRIZIONE DEI DATI QUANTITATIVI LE MISURE DI POSIZIONE Abbiamo cinque tipi di misure di posizione: la media aritmetica, la mediana, la moda, i quantili e il midrange. La media aritmetica si calcola dividendo la somma dei valori osservati per il numero totale di osservazioni: “M(X)=A/n=∑i=1 n xi/n”; “M(X)=∑i=1 n xini/n” (con distribuzione di frequenza). La mediana è il valore centrale in una successione ordinata di dati e, quindi, si lascia alla destra il 50% delle osservazioni e il 50% a sinistra. Se non c’è la distribuzione delle frequenze: Regola 1. Se l’ampiezza del campione “n” è dispari, la mediana coincide con il valore centrale e, quindi, il r(X0,5)=(n+1)/2  X0,5=x[(n+1)/2]. Regola 2. Se l’ampiezza del campione “n” è pari, ci sono due valori centrali e, quindi, il r(X0,5)=(n/2) e (n/2)+1  X0,5=x(n/2) e x[(n/2)+1]. La mediana allora coincide con la media dei due valori centrali: “(X0,5)=( x(n/2)+x[(n/2)+1] )/2”.
Docsity logo


Copyright © 2024 Ladybird Srl - Via Leonardo da Vinci 16, 10126, Torino, Italy - VAT 10816460017 - All rights reserved