R quadro in R: interpretazione e calcolo

La redazione di IONOS16 lug 20244 mins

Indice

R quadro (R2) è una metrica di errore nella statistica utilizzata in particolare per misurare la qualità delle regressioni lineari. Nella programmazione in R puoi calcolarlo richiamando una semplice funzione.

Perché R quadro è importante in R?

R quadro è una misura statistica della qualità di adattamento di un modello di regressione lineare rispetto ai dati. Accetta valori fra 0 e 1 ed è una misura centrale della qualità dei modelli di regressione.

L’interpretazione di R quadro fornisce informazioni su quanto i dati osservati si avvicinano a una retta di regressione calcolata. In generale: il modello descrive i dati tanto meglio, quanto maggiore è il valore di R quadro. Un basso valore di R quadro è indice di uno scarso adattamento del modello.

Consiglio

Con R puoi programmare una gran varietà di applicazioni diverse. Se sei alla ricerca di una soluzione di hosting per una di queste, uno spazio web personale fa al caso tuo. Con IONOS puoi noleggiare uno spazio web che puoi personalizzare in base alle tue esigenze con diversi piani tariffari.

R quadro in R con regressione lineare

R quadro in R è utilizzato spesso nell’ambito della regressione lineare. R è un linguaggio di programmazione che trova spesso applicazione in campo statistico. Pertanto è logico che sia dotato di diverse funzioni in R per agevolare i calcoli:

x <- c(1, 2, 3, 4, 5)
y <- c(2, 4, 5, 4, 5)
# Regressione lineare
model <- lm(y ~ x)

L’esempio di codice qui sopra crea innanzitutto due vettori in R di nome x e y che contengono i record di dati e sui quali deve essere eseguita la regressione lineare. In questo caso la variabile dipendente è y. Successivamente, il modello di regressione viene calcolato con la funzione in R lm() e quindi memorizzato nella variabile model.

R quadro in R: come calcolare R2 in R

È possibile calcolare il valore di R2 in R per mezzo di una funzione. Per farlo non ti servono nozioni matematiche approfondite, ma ti basta sapere come usare la funzione giusta. L’operazione è un gioco da ragazzi anche se hai appena iniziato a imparare la programmazione.

Per calcolare la misura statistica puoi usare la funzione summary(). Come il nome fa intuire, serve a ottenere un riassunto dell’analisi della regressione, compreso il valore di R quadro. Il seguente esempio di codice, basato sulla regressione lineare già calcolata, mostra l’utilizzo pratico della funzione summary():

# Come richiamare il valore di R quadro
summary(model)$r.squared

Con questo codice è possibile estrarre il valore di R quadro dal modello di regressione lineare lm_model. Il valore di R quadro indica la qualità con cui il modello descrive la variazione nella variabile dipendente y, sulla base della variabile indipendente x.

Nell’esempio di codice qui sopra, la funzione summary() è utilizzata sul modello di regressione già calcolato. Al tempo stesso viene utilizzato l’operatore in R $ per visualizzare soltanto il valore di R quadro tra tutti i valori restituiti dalla funzione. Nel nostro esempio il valore è 0,6.

Consiglio

Vuoi saperne di più sul mondo della programmazione in R? Negli articoli della nostra guida trovi tutte le informazioni che ti servono:

Il valore di R quadro: l’interpretazione

Dopo aver determinato il valore di R quadro, la questione passa a come interpretarne il risultato. A tal fine è utile osservare diversi intervalli in cui può ricadere il valore. Come già detto, il valore di R2 è compreso nell’intervallo fra 0 e 1.

0 (non adatto): un valore di R quadro pari a 0 indica che il modello non è per nulla adeguato ai dati. In questo caso non è presente alcuna correlazione lineare fra le variabili esaminate.
1 (adattamento perfetto): un valore di R quadro pari a 1 indica che tutte le osservazioni si trovano perfettamente sulla retta di regressione. Questo caso è molto raro e potrebbe essere segno di un sovradattamento (“overfitting” in inglese).
Tra 0,7 e 0,9 (buon adattamento): un valore di R quadro compreso in questo intervallo è segno che il modello è molto probabilmente in grado di descrivere i dati in modo sufficientemente buono.
Tra 0,5 e 0,7 (adattamento accettabile): un valore di R quadro compreso nell’intervallo tra 0,5 e 0,7 è accettabile, ma indica che è ancora presente un margine di miglioramento. È quindi possibile affinare ulteriormente il modello.
Sotto 0,5 (scarso adattamento): un valore di R quadro inferiore a 0,5 indica che il modello calcolato non descrive i dati alla base con sufficiente precisione. In questo caso è sicuramente consigliabile correggere il modello per ottenere risultati significativi.

N.B.

Un alto valore di R quadro non è sufficiente di per sé per valutare la qualità del tuo modello. Per questo motivo è necessario tenere conto anche di altri fattori, come la validazione del modello, l’analisi dei residui e l’adattamento ai requisiti specifici dei dati, quando devi determinare la qualità di un modello di regressione. La funzione summary() già descritta ti offre ulteriori indici che puoi utilizzare per la valutazione.

Hai trovato questo articolo utile?

Articoli simili

ESB ProfessionalShutterstock

Gli operatori in R: una panoramica

Gli operatori sono utilizzati nei linguaggi di programmazione come R per assegnare valori, eseguire calcoli aritmetici o verificare condizioni logiche. In questo articolo ti spieghiamo che cosa sono esattamente gli operatori in R. Inoltre, troverai alcuni esempi di codice per…

Tutorial

REDPIXEL.PLShutterstock

Le stringhe R in breve

Le stringhe sono presenti in pressoché tutti i linguaggi di programmazione. Anche il linguaggio R conosce le stringhe, quindi non fa eccezione. Qui scoprirai che cosa sono esattamente le stringhe in R e apprenderai le loro funzioni più utili. Sulla base di facili esempi ti…

Tutorial

Gli array in R: come funzionano

Come nella maggior parte dei linguaggi di programmazione, anche in R i programmatori e le programmatrici possono accedere agli array per memorizzare dati di uno stesso tipo all’interno di una struttura. Per mezzo di alcuni esempi di codice ti mostriamo come creare gli array in R…

Tutorial

kentohShutterstock

R: la funzione predict() per la modellazione predittiva

La funzione predict() in R è versatile e può essere utilizzata su diversi modelli, compresi i modelli lineari o gli alberi decisionali. Inoltre puoi adattare le previsioni per mezzo di numerosi parametri. Ad esempio è possibile definire intervalli di confidenza o preparare dati…

Tutorial

whiteMoccashutterstock

Funzioni gsub() e sub() in R: sostituzione di stringhe e caratteri

Le funzioni gsub() e sub() in R servono a cercare determinati modelli (espressioni regolari) all’interno delle stringhe e a sostituirli con altre sequenze di caratteri. Entrambi i metodi ti permettono di rimuovere o cambiare i caratteri indesiderati all’interno di grandi record…

Tutorial

ra2 studioShutterstock

Funzione substring() in R: come estrarre informazioni dalle stringhe

Con la funzione substring() in R è possibile estrarre facilmente le sottosequenze di caratteri da una stringa più grande indicandone l’indice iniziale e l’indice finale. La funzione è quindi un valido strumento per lavorare con dati non strutturati e ricavare informazioni…

Tutorial