R quadro in R: interpretazione e calcolo
R quadro (R2) è una metrica di errore nella statistica utilizzata in particolare per misurare la qualità delle regressioni lineari. Nella programmazione in R puoi calcolarlo richiamando una semplice funzione.
Perché R quadro è importante in R?
R quadro è una misura statistica della qualità di adattamento di un modello di regressione lineare rispetto ai dati. Accetta valori fra 0 e 1 ed è una misura centrale della qualità dei modelli di regressione.
L’interpretazione di R quadro fornisce informazioni su quanto i dati osservati si avvicinano a una retta di regressione calcolata. In generale: il modello descrive i dati tanto meglio, quanto maggiore è il valore di R quadro. Un basso valore di R quadro è indice di uno scarso adattamento del modello.
Con R puoi programmare una gran varietà di applicazioni diverse. Se sei alla ricerca di una soluzione di hosting per una di queste, uno spazio web personale fa al caso tuo. Con IONOS puoi noleggiare uno spazio web che puoi personalizzare in base alle tue esigenze con diversi piani tariffari.
R quadro in R con regressione lineare
R quadro in R è utilizzato spesso nell’ambito della regressione lineare. R è un linguaggio di programmazione che trova spesso applicazione in campo statistico. Pertanto è logico che sia dotato di diverse funzioni in R per agevolare i calcoli:
x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)
model <- lm(y ~ x)
RL’esempio di codice qui sopra crea innanzitutto due vettori in R di nome x e y che contengono i record di dati e sui quali deve essere eseguita la regressione lineare. In questo caso la variabile dipendente è y. Successivamente, il modello di regressione viene calcolato con la funzione in R lm()
e quindi memorizzato nella variabile model.
R quadro in R: come calcolare R2 in R
È possibile calcolare il valore di R2 in R per mezzo di una funzione. Per farlo non ti servono nozioni matematiche approfondite, ma ti basta sapere come usare la funzione giusta. L’operazione è un gioco da ragazzi anche se hai appena iniziato a imparare la programmazione.
Per calcolare la misura statistica puoi usare la funzione summary()
. Come il nome fa intuire, serve a ottenere un riassunto dell’analisi della regressione, compreso il valore di R quadro. Il seguente esempio di codice, basato sulla regressione lineare già calcolata, mostra l’utilizzo pratico della funzione summary()
:
# Come richiamare il valore di R quadro
summary(model)$r.squared
RCon questo codice è possibile estrarre il valore di R quadro dal modello di regressione lineare lm_model. Il valore di R quadro indica la qualità con cui il modello descrive la variazione nella variabile dipendente y, sulla base della variabile indipendente x.
Nell’esempio di codice qui sopra, la funzione summary()
è utilizzata sul modello di regressione già calcolato. Al tempo stesso viene utilizzato l’operatore in R $
per visualizzare soltanto il valore di R quadro tra tutti i valori restituiti dalla funzione. Nel nostro esempio il valore è 0,6.
Vuoi saperne di più sul mondo della programmazione in R? Negli articoli della nostra guida trovi tutte le informazioni che ti servono:
- Ciclo while in R
- Comandi in R
- Tipi di dati in R
- Stringhe in R
Il valore di R quadro: l’interpretazione
Dopo aver determinato il valore di R quadro, la questione passa a come interpretarne il risultato. A tal fine è utile osservare diversi intervalli in cui può ricadere il valore. Come già detto, il valore di R2 è compreso nell’intervallo fra 0 e 1.
- 0 (non adatto): un valore di R quadro pari a 0 indica che il modello non è per nulla adeguato ai dati. In questo caso non è presente alcuna correlazione lineare fra le variabili esaminate.
- 1 (adattamento perfetto): un valore di R quadro pari a 1 indica che tutte le osservazioni si trovano perfettamente sulla retta di regressione. Questo caso è molto raro e potrebbe essere segno di un sovradattamento (“overfitting” in inglese).
- Tra 0,7 e 0,9 (buon adattamento): un valore di R quadro compreso in questo intervallo è segno che il modello è molto probabilmente in grado di descrivere i dati in modo sufficientemente buono.
- Tra 0,5 e 0,7 (adattamento accettabile): un valore di R quadro compreso nell’intervallo tra 0,5 e 0,7 è accettabile, ma indica che è ancora presente un margine di miglioramento. È quindi possibile affinare ulteriormente il modello.
- Sotto 0,5 (scarso adattamento): un valore di R quadro inferiore a 0,5 indica che il modello calcolato non descrive i dati alla base con sufficiente precisione. In questo caso è sicuramente consigliabile correggere il modello per ottenere risultati significativi.
Un alto valore di R quadro non è sufficiente di per sé per valutare la qualità del tuo modello. Per questo motivo è necessario tenere conto anche di altri fattori, come la validazione del modello, l’analisi dei residui e l’adattamento ai requisiti specifici dei dati, quando devi determinare la qualità di un modello di regressione. La funzione summary()
già descritta ti offre ulteriori indici che puoi utilizzare per la valutazione.