In sta­ti­sti­ca ha senso rac­co­glie­re grandi quantità di dati solo se questi possono poi essere elaborati e ana­liz­za­ti. Il calcolo della mediana è un passaggio im­por­tan­te di questo processo. Tramite il calcolo della mediana è possibile ridurre un insieme di dati a una o poche cifre, cosicché relazioni complesse o temi specifici possano essere pre­sen­ta­ti in modo chiaro sotto forma di tabelle e diagrammi. Spie­ghe­re­mo qui di seguito come calcolare e in­ter­pre­ta­re la mediana, passo dopo passo.

Che cos’è la mediana?

La mediana – detta anche valore centrale – viene dalla sta­ti­sti­ca e, data una lista di valori in ordine di grandezza, indica il valore che si trova esat­ta­men­te a metà della stessa. Nella sta­ti­sti­ca de­scrit­ti­va, la mediana è detta anche indice di posizione e viene uti­liz­za­ta per esprimere la tendenza centrale di una raccolta dati.

N.B.

Non con­fon­de­re la mediana con il valore medio o la media. Questa si calcola facendo la somma di tutti i valori, di­vi­den­do­la poi per il numero totale di valori presenti. La mediana rap­pre­sen­ta, invece, il valore che si trova al centro di una lista di valori messi in ordine crescente.

Che formula si usa per calcolare la mediana?

Per calcolare la mediana di una serie di dati si possono usare due diverse formule, a seconda del numero di valori osservati. Il simbolo generale per la mediana è (cioè la lettera x con la tilde), dove indica il numero di valori osservati e rap­pre­sen­ta un valore specifico nella serie di dati.

Se il numero totale di valori osservati è dispari, uti­liz­za­te questa formula:

Se il numero totale di valori osservati è pari, uti­liz­za­te questa formula:

Vi spie­ghe­re­mo qui di seguito entrambi i casi con due semplici esempi.

Calcolare la mediana: come fare

Esempio 1: numero dispari di valori

Nel nostro primo esempio abbiamo un numero dispari di valori osservati. Im­ma­gi­na­te che a undici par­te­ci­pan­ti a un seminario di for­ma­zio­ne venga chiesta l’età e che le risposte siano le seguenti:

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49

Il primo passo è di mettere le risposte in ordine crescente:

19, 26, 28, 29, 34, 38, 43, 45, 49, 51, 62

Ognuno dei valori dati cor­ri­spon­de a un de­ter­mi­na­to valore . Cioè 19 = , 26 = , 28 = , ecc. Il vantaggio di un numero dispari di valori osservati è che adesso possiamo in­di­vi­dua­re subito la mediana. Nel nostro caso è = 38 perché questo valore divide la serie di numeri a metà. Metà delle età (19, 26, 28, 29, 34) è minore della mediana, mentre l’altra metà (43, 45, 49, 51, 62) è maggiore.

Potete anche calcolare la mediana ap­pli­can­do la formula della sezione pre­ce­den­te. sta per il numero di valori osservati, in questo caso 11. La formula è la seguente:

Dato che sta per 38, arriviamo allo stesso risultato. La mediana delle età raccolte al seminario è 38, poiché questo valore si trova esat­ta­men­te a metà della lista dei numeri disposti in ordine di grandezza.

Esempio 2: numero pari di valori

In questo caso la mediana non è così facile da in­di­vi­dua­re perché il numero di valori osservati è pari e la mediana non è in una posizione centrale della serie di dati.

Im­ma­gi­na­te che al seminario di for­ma­zio­ne suc­ces­si­vo si aggiunga un altro par­te­ci­pan­te e che, questa volta, l’età venga quindi chiesta a dodici persone. Le risposte sono le seguenti:

28, 34, 51, 19, 62, 43, 29, 38, 45, 26, 49, 33

Adesso dovete rior­ga­niz­za­re i dati in ordine crescente, de­no­mi­nan­do­li da a .

19, 26, 28, 29, 33, 34, 38, 43, 45, 49, 51, 62

Con = 12 si utilizza la formula per i valori osservati pari:

La me­dia­na­del­le età di questo secondo seminario è di 36 anni.

N.B.

Se si lavora con il programma di fogli di calcolo Excel, non è ne­ces­sa­rio calcolare la mediana ma­nual­men­te. Excel offre un’utile funzione mediana, che calcola il risultato corretto, ra­pi­da­men­te e senza errori.

Dif­fe­ren­ze rispetto alla media arit­me­ti­ca e alla moda

Come abbiamo già spiegato, la mediana non deve essere confusa con il valore medio o la media, detta anche media arit­me­ti­ca, che si usa per trovare il valore medio di un insieme di dati. Nel nostro primo esempio, l’età media sarebbe 38,5 (la somma dei dati divisa per il numero di par­te­ci­pan­ti). Esiste poi anche la co­sid­det­ta moda, che indica, invece, il valore più frequente in un set di dati. Nei nostri esempi, di fatto, tutti i valori sono una moda perché sono unici e nessuno di essi si ripete.

Utilizzo della mediana

Ma quando conviene calcolare la mediana e quando, invece, uti­liz­za­re la media arit­me­ti­ca o la moda?

Dipende tutto dalla si­tua­zio­ne. Anche se la media arit­me­ti­ca è ge­ne­ral­men­te con­si­de­ra­ta più precisa e molto ef­fi­cien­te in sta­ti­sti­ca, è anche più sensibile agli outlier. Ciò significa che basta anche un solo dato sbagliato nella raccolta per di­stor­ce­re il valore medio in modo con­si­de­re­vo­le. Anche se la mediana non è precisa o ef­fi­cien­te quanto la media arit­me­ti­ca, è con­si­de­ra­ta più robusta e viene quindi spesso uti­liz­za­ta quando i set di dati sono con­ta­mi­na­ti.

La moda, invece, si usa quando non si ha a che fare con valori numerici ma con altre ca­rat­te­ri­sti­che, ad esempio se offrite un prodotto in diversi colori e volete scoprire quale colore viene ac­qui­sta­to più spesso.

Vai al menu prin­ci­pa­le