R quadro (R2) è una metrica di errore nella sta­ti­sti­ca uti­liz­za­ta in par­ti­co­la­re per misurare la qualità delle re­gres­sio­ni lineari. Nella pro­gram­ma­zio­ne in R puoi cal­co­lar­lo ri­chia­man­do una semplice funzione.

Perché R quadro è im­por­tan­te in R?

R quadro è una misura sta­ti­sti­ca della qualità di adat­ta­men­to di un modello di re­gres­sio­ne lineare rispetto ai dati. Accetta valori fra 0 e 1 ed è una misura centrale della qualità dei modelli di re­gres­sio­ne.

L’in­ter­pre­ta­zio­ne di R quadro fornisce in­for­ma­zio­ni su quanto i dati osservati si av­vi­ci­na­no a una retta di re­gres­sio­ne calcolata. In generale: il modello descrive i dati tanto meglio, quanto maggiore è il valore di R quadro. Un basso valore di R quadro è indice di uno scarso adat­ta­men­to del modello.

Consiglio

Con R puoi pro­gram­ma­re una gran varietà di ap­pli­ca­zio­ni diverse. Se sei alla ricerca di una soluzione di hosting per una di queste, uno spazio web personale fa al caso tuo. Con IONOS puoi no­leg­gia­re uno spazio web che puoi per­so­na­liz­za­re in base alle tue esigenze con diversi piani tariffari.

R quadro in R con re­gres­sio­ne lineare

R quadro in R è uti­liz­za­to spesso nell’ambito della re­gres­sio­ne lineare. R è un lin­guag­gio di pro­gram­ma­zio­ne che trova spesso ap­pli­ca­zio­ne in campo sta­ti­sti­co. Pertanto è logico che sia dotato di diverse funzioni in R per agevolare i calcoli:

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)
# Regressione lineare
model <- lm(y ~ x)
R

L’esempio di codice qui sopra crea in­nan­zi­tut­to due vettori in R di nome x e y che con­ten­go­no i record di dati e sui quali deve essere eseguita la re­gres­sio­ne lineare. In questo caso la variabile di­pen­den­te è y. Suc­ces­si­va­men­te, il modello di re­gres­sio­ne viene calcolato con la funzione in R lm() e quindi me­mo­riz­za­to nella variabile model.

R quadro in R: come calcolare R2 in R

È possibile calcolare il valore di R2 in R per mezzo di una funzione. Per farlo non ti servono nozioni ma­te­ma­ti­che ap­pro­fon­di­te, ma ti basta sapere come usare la funzione giusta. L’ope­ra­zio­ne è un gioco da ragazzi anche se hai appena iniziato a imparare la pro­gram­ma­zio­ne.

Per calcolare la misura sta­ti­sti­ca puoi usare la funzione summary(). Come il nome fa intuire, serve a ottenere un riassunto dell’analisi della re­gres­sio­ne, compreso il valore di R quadro. Il seguente esempio di codice, basato sulla re­gres­sio­ne lineare già calcolata, mostra l’utilizzo pratico della funzione summary():

# Come richiamare il valore di R quadro
summary(model)$r.squared
R

Con questo codice è possibile estrarre il valore di R quadro dal modello di re­gres­sio­ne lineare lm_model. Il valore di R quadro indica la qualità con cui il modello descrive la va­ria­zio­ne nella variabile di­pen­den­te y, sulla base della variabile in­di­pen­den­te x.

Nell’esempio di codice qui sopra, la funzione summary() è uti­liz­za­ta sul modello di re­gres­sio­ne già calcolato. Al tempo stesso viene uti­liz­za­to l’operatore in R $ per vi­sua­liz­za­re soltanto il valore di R quadro tra tutti i valori re­sti­tui­ti dalla funzione. Nel nostro esempio il valore è 0,6.

Consiglio

Vuoi saperne di più sul mondo della pro­gram­ma­zio­ne in R? Negli articoli della nostra guida trovi tutte le in­for­ma­zio­ni che ti servono:

Il valore di R quadro: l’in­ter­pre­ta­zio­ne

Dopo aver de­ter­mi­na­to il valore di R quadro, la questione passa a come in­ter­pre­tar­ne il risultato. A tal fine è utile osservare diversi in­ter­val­li in cui può ricadere il valore. Come già detto, il valore di R2 è compreso nell’in­ter­val­lo fra 0 e 1.

  • 0 (non adatto): un valore di R quadro pari a 0 indica che il modello non è per nulla adeguato ai dati. In questo caso non è presente alcuna cor­re­la­zio­ne lineare fra le variabili esaminate.
  • 1 (adat­ta­men­to perfetto): un valore di R quadro pari a 1 indica che tutte le os­ser­va­zio­ni si trovano per­fet­ta­men­te sulla retta di re­gres­sio­ne. Questo caso è molto raro e potrebbe essere segno di un so­vra­dat­ta­men­to (“over­fit­ting” in inglese).
  • Tra 0,7 e 0,9 (buon adat­ta­men­to): un valore di R quadro compreso in questo in­ter­val­lo è segno che il modello è molto pro­ba­bil­men­te in grado di de­scri­ve­re i dati in modo suf­fi­cien­te­men­te buono.
  • Tra 0,5 e 0,7 (adat­ta­men­to ac­cet­ta­bi­le): un valore di R quadro compreso nell’in­ter­val­lo tra 0,5 e 0,7 è ac­cet­ta­bi­le, ma indica che è ancora presente un margine di mi­glio­ra­men­to. È quindi possibile affinare ul­te­rior­men­te il modello.
  • Sotto 0,5 (scarso adat­ta­men­to): un valore di R quadro inferiore a 0,5 indica che il modello calcolato non descrive i dati alla base con suf­fi­cien­te pre­ci­sio­ne. In questo caso è si­cu­ra­men­te con­si­glia­bi­le cor­reg­ge­re il modello per ottenere risultati si­gni­fi­ca­ti­vi.
N.B.

Un alto valore di R quadro non è suf­fi­cien­te di per sé per valutare la qualità del tuo modello. Per questo motivo è ne­ces­sa­rio tenere conto anche di altri fattori, come la va­li­da­zio­ne del modello, l’analisi dei residui e l’adat­ta­men­to ai requisiti specifici dei dati, quando devi de­ter­mi­na­re la qualità di un modello di re­gres­sio­ne. La funzione summary() già descritta ti offre ulteriori indici che puoi uti­liz­za­re per la va­lu­ta­zio­ne.

Vai al menu prin­ci­pa­le