Definizione dimensione campione
Migliora il tuo sito web e smettere di indovinare.
Inizia un test A/B (prova GRATUITA di 30 giorni)
La dimensione del campione è un termine usato nelle ricerche di mercato per definire il numero di soggetti inclusi in una dimensione del campione. Per dimensione del campione, comprendiamo un gruppo di soggetti selezionati dalla popolazione generale ed è considerato un rappresentante della popolazione reale per quello specifico studio.
Ad esempio, se vogliamo prevedere come la popolazione in una specifica fascia di età reagirà a un nuovo prodotto, possiamo prima testarlo su una dimensione del campione rappresentativa della popolazione mirata. La dimensione del campione, in questo caso, sarà data dal numero di persone in quella fascia di età che verranno esaminate.
Calcolo della dimensione del campione
L’uso di formule statistiche per determinare la dimensione del campione implica, prima di tutto, la scelta di un significativo punto di riferimento per le misure sulla base dei risultati forniti dalla ricerca qualitativa per essere eseguita, di solito, il ricercatore ha, in questo senso, due sono le alternative:
È possibile monitorare la misurazione di variabili e di determinare specifici indicatori che esprimono la loro evoluzione. Così, il ricercatore può seguire la determinazione della frequenza di visita di una unità commerciale e l’indicatore appropriato per descrivere questa variabile la media settimanale di frequenza di visita del gruppo in questione, nella letteratura specializzata, la scelta di questa alternativa è designato sotto il concetto di campionamento in relazione alle variabili studiate.
Può essere finalizzato alla valutazione di attributi specifici del fenomeno di marketing indagato. Ad esempio, il ricercatore può perseguire l’identificazione delle preferenze dei consumatori per la disposizione interna di un’unità commerciale, questo valutando un insieme di attributi rappresentativi per l’interior design, nella letteratura specializzata, la scelta di questa alternativa è designata sotto il concetto di campionamento con le caratteristiche investigate.
La formula della dimensione del campione è:
N = dimensione della popolazione • e = Margine di errore (percentuale in forma decimale • * z = punteggio z
Un’altra formula della dimensione del campione è:
n = N*X / (X + N – 1),
dove
X = Za/22 *p*(1-p) / MOE2,
Za/2 è il valore critico della distribuzione Normale a α/2 (per un livello di confidenza del 95%, α è di 0,05 e il valore critico è di 1.96), MOE è il margine di errore, p è il campione proporzione, e N è la dimensione della popolazione. Si noti che una correzione della popolazione finita è stata applicata alla formula della dimensione del campione.
Sample size process
Il processo sampling size prevede diverse attività specifiche, ovvero:
* definizione della popolazione oggetto della ricerca;
* scelta del frame di campionamento;
* scelta del metodo di campionamento;
* determinazione delle modalità di selezione delle unità di campionamento;
* determinazione della madre della dimensione del campione;
* scelta delle unità effettive della dimensione del campione;
* conduzione dell’attività sul campo.
La definizione della popolazione target deve essere fatta con grande cura per evitare la tendenza a scegliere una popolazione grande ingiustificata o l’inclinazione a selezionare una popolazione ingiustificatamente ristretta. Ad esempio, per le aziende che producono automobili, la popolazione totale può essere rappresentata dalle persone di tutto il paese, compresi i bambini di età diverse.
Ma la popolazione pertinente, che sarà oggetto della ricerca, sarà composta solo dalla popolazione di età superiore ai 18 anni. Non può essere ammessa alcuna popolazione ingiustificatamente limitata come, ad esempio, la popolazione maschile di età compresa tra 25 e 50 anni. Ciò può coprire gran parte del mercato automobilistico, ma esclude alcuni segmenti essenziali.
In pratica, nel caso di campionamento casuale, il campione sarà scelto da un elenco della popolazione che spesso differisce, in una certa misura, dalla popolazione oggetto della ricerca. Questo elenco rappresenta il quadro di campionamento o la base di campionamento in quanto contiene gli elementi da cui il campione deve essere costituito.
La creazione del campione implica la creazione dell’unità di campionamento. L’unità di campionamento è rappresentata da un elemento distinto o da un gruppo di elementi diversi all’interno della popolazione indagata, che può essere selezionato per formare il campione. L’unità di campionamento può essere una persona, una famiglia, una famiglia, un’azienda o un’azienda, una località, ecc. È necessario specificare che l’unità di campionamento non è sempre identica all’unità di analisi. Ad esempio, nello studio delle spese familiari, l’unità di campionamento può essere la casa o la famiglia e l’unità di analisi può essere una persona o una famiglia.
Definizioni importanti nella ricerca
- Margine di errore
Il margine di errore è la quantità di precisione necessaria. Questo è il numero più o meno che viene spesso riportato con una percentuale stimata e può anche essere indicato come l’intervallo di confidenza. È l’intervallo in cui si stima che il vero rapporto di popolazione sia ed è spesso espresso in punti percentuali (ad esempio, ±2 percento ). Essere consapevoli dopo aver raccolto le informazioni sarà probabilmente più o meno di questa somma obiettivo perché sarà dipendente dalla proporzione piuttosto che la percentuale del campione che la precisione raggiunta.
- Livello di confidenza
Il livello di confidenza è la probabilità che la proporzione vera sia contenuta dal margine di errore. Nel caso in cui lo studio fosse ripetuto e ogni volta fosse calcolato dall’intervallo, ci si aspetterebbe che il vero valore si trovi all’interno di questi intervalli sul 95% degli eventi. Più alto è il livello di confidenza, più si può essere certi che l’intervallo includa il vero rapporto.
- Popolazione
Questo è l’intero numero di individui sulla tua popolazione. In questa formula, usiamo una correzione della popolazione finita per tenere conto del campionamento da popolazioni piccole. Ma non sai quanto grande sei in grado di usare 100.000 se la tua popolazione è grande. La dimensione del campione non cambia considerevolmente per le persone più grandi.
- Definizione del rapporto di campionamento
La proporzione del campione è ciò che ci si aspetta che i risultati siano. Questo può spesso essere impostato utilizzando i risultati in un sondaggio, o eseguendo piccole ricerche pilota. Usa il 50%, che fornisce la dimensione del campione più significativa ed è conservativa, se non sei sicuro. Si noti che questo calcolo della dimensione del campione utilizza l’approssimazione normale alla distribuzione binomiale. Nel caso in cui il rapporto del campione sia vicino a 1 o 0, questa approssimazione non è valida e si desidera prendere in considerazione un metodo di calcolo della dimensione del campione alternativo.
- Dimensione del campione
Ecco la dimensione minima del campione necessaria per misurare il rapporto di popolazione reale. Si noti che se alcune persone scelgono di non rispondere se la mancata risposta è una possibilità e che non possono essere contenute nel campione, la dimensione del campione dovrà essere aumentata. In generale, maggiore è la velocità di risposta, migliore sarà la citazione porterà a pregiudizi nella vostra citazione.
Qual è la deviazione standard?
La deviazione standard è una statistica che misura la dispersione di un set di dati rispetto alla sua media e può essere calcolata come radice quadrata della varianza. Viene calcolato come radice quadrata della varianza specificando la variazione tra ciascun punto dati rispetto alla media. Se i punti di dati sono dalla media, è una deviazione superiore all’interno del set di dati; di conseguenza, i dati, maggiore è la deviazione standard.
Come determinare la dimensione del campione?
Non possiamo testare l’intera popolazione. La dimensione del campione si basa su intervalli di confidenza: siamo interessati a calcolare il parametro di popolazione, a misurare la dimensione del campione. Pertanto, dovremmo stabilire gli intervalli di confidenza, in modo che i valori di questo campione si trovino all’interno di tale intervallo. Il campionamento risponde alla domanda su come? Quanti? Per popolazione, comprendiamo tutti i membri di una comunità specifica e il cui carattere è una certa legge naturale, una caratteristica specifica, particolarità (es: giovani 18-25 anni, studenti).
Che cosa è una buona dimensione del campione? La dimensione del campione è un sottoinsieme, un estratto, diverse persone estratte da quella popolazione. La popolazione è considerata infinita; in pratica, non possiamo studiare un numero infinito di casi.
I comportamenti, i punteggi, ottenuti misurando la dimensione del campione vengono utilizzati per dedurre, una stima per inferenza statistica i punteggi oi comportamenti che raccoglieremmo se testassimo l’intera popolazione.
Determinazione della dimensione del campione (come selezioniamo).
Principio fondamentale: il numero di partecipanti considerati accettabili per formare un saggio rappresentativo dipende dal tipo di ricerca. Pertanto, per gli studi correlazionali, 30 partecipanti sono sufficienti per creare una dimensione rappresentativa del campione (si accetta che da 30 soggetti, la distribuzione sia normale). Per le ricerche sperimentali e quasi sperimentali (simile all’esperimento tranne che i partecipanti non sono divisi casualmente in due gruppi, abbiamo trovato i gruppi già formati).
Per la ricerca descrittiva (es: aviatori), è sufficiente un numero di 20% della rispettiva popolazione. Più grande è la popolazione, minore è la percentuale. Es: 20% di 1000 persone = 200 persone; 10% di 5000 pers = 500 pers. Per le piccole popolazioni (meno di 100 persone), la dimensione del campione è approssimativamente uguale alla popolazione. Per la popolazione media (circa 500 persone) ca. 20%. Per le popolazioni più grandi (è 5000 pers), circa 400 pers, ma anche una dimensione del campione di 1% può essere significativa.
immagine creata con: Flyer Maker
ALGORITMI di CAMPIONAMENTO
- campione Casuale di dimensione
(1) L’individuazione e la definizione della popolazione
Ex. La popolazione è composta da tutti i direttori scolastici 5000 in un paese casuale.
(2) Determinazione della dimensione del campione (ricerca descrittiva)
Ex. La dimensione del campione sarà composta da 10% dei dirigenti 5000, con conseguente 500 persone.
Se è correlazionale o sperimentale, N = min 30.
(3) Facciamo una lista di tutti i membri della popolazione.
Es. Tutti i presidi scolastici sono sulla lista
(4) Un numero viene assegnato a ciascun elencato. Se abbiamo fino a un migliaio di persone, i numeri da 000 sono dati, e l’ultimo della lista avrà 999; Se abbiamo 100 persone 00-99.
Es. Nella lista dei direttori, dare numeri ad ogni primo avrà 0000 e l’ultimo 4999.
(5) Ci sono tabelle con numeri casuali, e quindi un nome dalle tabelle con numeri casuali è selezionato in modo casuale.
Es. Dal tavolo è stato scelto 53634 (su 5 non consideriamo che abbiamo 5000 persone).
(6) Dal numero estratto, tutti i numeri o quanti numeri sono richiesti a seconda della popolazione da cui estraiamo.
Ad es. Abbiamo solo 5000 persone.
(7) Se abbiamo imprigionamento al numero impostato, lo inseriamo nella tabella dell’elenco delle dimensioni del campione.
Es. Perché c’è il regista con il numero 3634in, andiamo nella dimensione del campione.
(8) Vai al numero successivo sulla colonna.
Variante: Scegliamo il metodo dell’urna se non siamo d’accordo con il processo, cioè tutti i numeri d’ordine dei partecipanti oi loro nomi sono inclusi nell’urna e estraiamo il numero necessario per la preparazione della dimensione del campione.
- Dimensione sistematica del campione
È stabilita in base al tipo di ricerca: descrittiva, correlazionale
(1) Identificazione e definizione della popolazione.
Es. La popolazione è composta da tutti i 5000 insegnanti di una regione casuale in un paese.
(2) Determinazione della dimensione del campione (ricerca descrittiva)
Ex. Supponiamo che sia una ricerca descrittiva, si scopre che il 10% della popolazione = 500 persone
(3) Facciamo una lista con tutti i membri della popolazione
Ex. I 5000 insegnanti sono disposti in ordine alfabetico; già, l’elenco non è composto a caso, ma la procedura è valida.
(4) Determinare il parametro o il passaggio K = dimensione popolazione / dimensione campione.
Es. K = 5000/500 = 10
(5) Inizia con una certa posizione all’inizio della lista.
Es. Supponiamo di mettere il dito sul 3 ° nome (usando direttamente l’elenco).
(6) A partire dalla posizione scelta, ogni nome K viene scelto.
ES. Nella nostra dimensione del campione: 3-13-23-33-ecc.
(7) Se la dimensione del campione non fosse stata composta alla fine dell’elenco, tornerebbe dall’inizio;
- Dimensione del campione stratificato
(1) Identificazione e definizione della popolazione.
Es. Per confrontare l’efficienza di due metodi di formazione della competenza psicosociale nella gestione in base al livello di autostima, la popolazione è composta dai top manager 300 di una città casuale.
(2) Determinazione della dimensione del campione (calcolo della dimensione del campione)
Ex. La dimensione del campione sarà di 45 manager per i metodi a e b
(3) La variabile e i sottogruppi sono stabiliti, i livelli per rappresentare la rappresentatività (numero uguale / numero proporzionale in ciascun sottogruppo.
Es. I sottogruppi desiderati sono stabiliti in base a tre livelli di autostima: medio, alto, basso (età, livello di formazione, maschio-femmina)
(4) I membri della popolazione sono divisi in uno dei sottogruppi stabiliti.
Es.300 manager sono classificati in base al livello di autostima: 45 alta autostima, 225 media autostima, 40 bassa autostima.
(5) Semplicemente campionando (usiamo la tabella con numerazione in disordine o disegno a lotti). Il numero di partecipanti di ciascun sottogruppo (numero proporzionale) è stabilito
Ex. Determiniamo che da ogni livello viene estratto un numero di 30. Usando la tabella con numeri casuali o sorteggio, estraiamo 30 manager con alta autostima, 30 con autostima media, 30 con bassa autostima. I 30 partecipanti di ciascuna dimensione del campione così composta li distribuiscono casualmente (metà metodo A e metà metodo B)
- Dimensione del campione multistadio
La selezione dei partecipanti che compongono la dimensione del campione viene effettuata indirettamente attraverso la selezione dei gruppi di cui i partecipanti fanno parte.
(1) Identificazione e definizione della popolazione.
Es. La popolazione è composta da tutti i 5000 insegnanti delle scuole localizzate da una regione casuale in un paese.
(2) Determinazione della dimensione del campione (Ricerca descrittiva)
Ex. Dimensione del campione = 10% = 500.
(3) Stabilire il tipo logico (Cluster)
Ex. Il cluster è la scuola.
(4) La lista contenente i gruppi che compongono la popolazione è fatta
Ex. L’elenco è composto da 100 scuole provenienti da una regione casuale in un paese.
(5) Il numero di popolazione per ciascun gruppo è stimato. (Cluster)
Es. Sebbene le scuole differiscano nel numero di insegnanti, scegliamo solo 50 da ogni scuola
(6) Il numero di gruppi è determinato dividendo la dimensione del campione per la dimensione stimata dei gruppi.
Es.500 / 50 = 10.
(7) Il numero di gruppi viene selezionato casualmente attraverso la tabella con numeri casuali o l’urna.
Es. Selezioniamo 10 scuole tra le 100 scuole di una regione casuale in un paese!
(8) Tutti i membri dei gruppi selezionati fanno parte della dimensione del campione.
Es. Tutti gli insegnanti delle 10 scuole fanno parte della dimensione del campione.
Concludiamo.
Il modo migliore per creare una dimensione rappresentativa del campione è il campionamento casuale.
Dimensione del campione Dimensione e dimensione del campione tipo:
La probabilità dipende dal tipo di ricerca. Per la ricerca correlazionale e sperimentale, un numero di soggetti 30 è sufficiente per la ricerca descrittiva a seconda della dimensione della popolazione dall ‘ 1 al 10%.
Indipendentemente dalla tecnica specifica utilizzata nelle grandi fasi di campionamento, consistono in:
- identificazione della popolazione
- determinazione della dimensione del campione richiesta
- selezione dei partecipanti.
- raccolta dati
Il semplice campionamento casuale è il modo migliore per ottenere una dimensione rappresentativa o stabilizzata del campione se abbiamo una variante eccitante (autostima).
La fonte primaria di deformare le tendenze nel campionamento è l’uso del metodo nonprobabilistico.
L’utilizzo di tecniche non standard è solitamente difficile se non è impossibile descrivere la popolazione della popolazione da cui è stata estratta la dimensione del campione e generalizzare i risultati dalla dimensione del campione alla rispettiva popolazione.
Pericoli di piccole dimensioni del campione
Ad esempio, saremmo tentati di dire in modo che la dimensione del campione significa ottenuto su un volume più grande dimensione del campione è sempre più preciso rispetto alla dimensione media del campione ottenuto su un volume più piccolo dimensione del campione, che non è valido.
È vero, è solo una dichiarazione: una dimensione del campione più grande significa che su un volume più grande la dimensione del campione è più probabilmente più accurata di quella ottenuta su una dimensione del campione di volume più piccola. È possibile che, attraverso il gioco d’azzardo, una media ottenuta su campioni di dimensioni maggiori sia ben oltre la media reale rispetto alla media raccolta su campioni di dimensioni minori. Solo questa situazione è meno probabile, con meno probabilità, maggiore è la differenza di volume tra le due dimensioni del campione.
Se riduciamo i termini dell’equazione all’estremo, comprendiamo che il livello di significatività del test può essere raggiunto sia con una piccola dimensione del campione, con una grande dimensione dell’effetto, ma anche con una dimensione del campione sufficientemente grande, quando la dimensione dell’effetto è piccola. In altre parole, le piccole dimensioni dell’effetto possono essere compensate aumentando il numero di soggetti, il che solleva la questione della conclusione della ricerca di rilevanza.
L’errore sistematico deriva da fattori non correlati alla dimensione del campione. Questi fattori che generano l’errore standard sono legati per le imperfezioni del processo di campionamento, come, per esempio, errori nella selezione delle unità campionarie, errori nel campionamento, errori di misura, camere non-risposte, risposte che non corrispondono alla realtà, il rifiuto di partecipare durante l’inchiesta, etc.
Indagine sulla soddisfazione dei clienti e ricerche di mercato
Le indagini sulla soddisfazione dei clienti non dipendono dalla dimensione del campione statisticamente significativa. Queste indagini devono essere accurate e avere risposte più precise. È vitale per te analizzare attentamente ogni risposta che un cliente ha dato, in un sondaggio sulla soddisfazione del cliente. Tutte le risposte, positive o negative, è importante.
Quando si tratta di ricerche di mercato, una dimensione del campione statisticamente significativa aiuta molto. Queste indagini di mercato aiutano a scoprire nuove informazioni sui clienti e sul mercato che si desidera attivare. Con questo sondaggio, riceverai le ultime informazioni sul mercato di riferimento e sui clienti che acquisterebbero i tuoi servizi o prodotti.
Qual è la dimensione di un campione nella ricerca?
La dimensione del campione nella ricerca può aiutare a scoprire quante più informazioni su un mercato target specifico o su un certo tipo di cliente.
Calcolo della dimensione del campione per un test AB
Qualsiasi esperimento che implichi inferenza statistica richiede un calcolo della dimensione del campione fatto prima dell’inizio di tale esperimento. I test A / B (split testing) non fanno eccezione. Misurare il numero minimo di visitatori richiesto per una valutazione AB prima di iniziare ci impedisce di eseguire il test per ottenere una dimensione del campione più piccola, quindi con un test”sottodimensionato”.
Stabiliamo tre criteri prima di iniziare a eseguire l’esperimento:
- Il livello di significatività per il tuo esperimento: Un livello di significatività del 5% significa che se dichiari un vincitore nella tua valutazione AB, hai una probabilità del 95% che tu abbia ragione nel farlo. Suggerisce anche di avere una differenza di effetto significativa tra il controllo e la variante con una confidenza del 95%.”Questa soglia è, chiaramente, un arbitrario e uno quando si effettua la progettazione di un esperimento lo sceglie.
- Effetto minimo rilevabile: La differenza desiderabile e importante tra i prezzi che vorresti trovare
- La potenza di valutazione: la probabilità di rilevare quella differenza tra il tasso originale e i tassi di conversione della variante.