I comandi in R: una panoramica dei comandi più importanti
I comandi in R sono alla base dell’analisi dei dati e della modellazione statistica nell’ambiente R. Questi comandi ti offrono gli strumenti e la flessibilità per capire i dati, riconoscere i modelli e prendere decisioni informate.
Che cosa sono i comandi in R?
I comandi in R sono istruzioni o comandi utilizzati nella programmazione in R per eseguire compiti specifici o inizializzare azioni nell’ambiente R. Questi comandi ti permettono di analizzare i dati, eseguire calcoli statistici o creare visualizzazioni. È possibile immettere ed elaborare i comandi in R nella riga di comando R o in script R. È importante distinguere i comandi dalle funzioni in R.
Le funzioni in R sono blocchi di codice definiti e denominati in R che svolgono compiti determinati. Al loro interno possono comprendere l’utilizzo di operatori in R e dati in R per accettare argomenti o restituire determinati valori. In pratica, le funzioni possono memorizzare, elaborare e restituire dati che sono collegati a diversi tipi di dati in R.
Con lo spazio web di IONOS hai a disposizione almeno 50 GB di spazio libero e potenti server ad alta disponibilità per avere la certezza che il tuo sito web sia sempre online e veloce da caricare. La soluzione ti offre inoltre un dominio gratuito e un certificato SSL Wildcard per garantire la sicurezza del tuo sito web.
Panoramica dei comandi in R
La seguente lista di comandi in R è una panoramica sui diversi campi di applicazione nella programmazione in R. A seconda delle esigenze e dei requisiti specifici puoi scegliere e combinare fra loro i comandi in R più adatti.
Manipolazione ed elaborazione dei dati
-
read.csv()
: carica in memoria i dati da un file CSV -
data.frame()
: crea un frame di dati -
subset()
: filtra i dati in base a determinate condizioni -
merge()
: unisce i dati da diversi frame di dati -
aggregate()
: aggrega i dati in base a determinati criteri -
transform()
: crea nuove variabili in un frame di dati -
sort()
: ordina vettori o frame di dati -
unique()
: identifica valori univoci in un vettore o in una colonna
Visualizzazione dei dati
-
plot()
: crea grafici a dispersione e altri tipi di grafici di base -
hist()
: crea istogrammi -
barplot()
: crea grafici a barre -
boxplot()
: crea grafici a scatola e baffi (chiamati proprio “boxplot”) -
ggplot2::ggplot()
: per visualizzazioni più complesse e adattabili con il pacchetto ggplot2
Analisi statistiche
-
summary()
: prepara un riepilogo dei dati, compresi gli indici statistici -
lm()
: esegue regressioni lineari -
t.test()
: esegue test T per test delle ipotesi -
cor()
: calcola i coefficienti di correlazione fra variabili -
anova()
: esegue analisi della varianza (ANOVA) -
chi-sq.test()
: esegue test del chi quadrato
Elaborazione dei dati
-
ifelse()
: valuta le condizioni e le espressioni condizionali -
apply()
: applica una funzione su matrici o frame di dati -
dplyr::filter()
: filtra i dati in frame di dati con il pacchetto dplyr -
dplyr::mutate()
: crea nuove variabili in frame di dati con il pacchetto dplyr -
lapply()
,sapply()
,mapply()
: applica funzioni su liste o vettori
Importazione ed esportazione dei dati
-
readRDS()
,saveRDS()
: carica e salva oggetti dati in R -
write.csv()
,read.table()
: esporta e importa dati in diversi formati
Grafici e diagrammi statistici
-
qqnorm()
,qqline()
: crea grafici quantile-quantile -
plot()
,acf()
: mostra grafici di autocorrelazione -
density()
: mostra funzioni di densità e istogrammi -
heatmap()
: crea mappe di calore
Esempi di utilizzo dei comandi in R
I seguenti esempi di codice servono a mostrarti l’utilizzo dei più importanti comandi in R in diversi campi di applicazione. Se necessario, puoi modificare e ampliare questi comandi a seconda dei tuoi dati e requisiti di analisi.
Caricamento in memoria di dati da un file CSV
data <- read.csv("dati.csv")
RIl comando read.csv()
permette di caricare i dati da un file CSV in R. Nel nostro esempio, i dati caricati vengono memorizzati nella variabile data
. Questo comando è utile per importare dati esterni in R e renderli disponibili per le analisi.
Creazione di un grafico a dispersione
plot(data$X, data$Y, main="Grafico a dispersione")
RIl comando plot()
è uno dei comandi in R che servono a creare grafici e diagrammi in R. In questo caso viene tracciato un grafico a dispersione che raffigura la relazione fra le variabili X
e Y
del frame di dati data
. L’argomento main
stabilisce il titolo del grafico.
Esecuzione di una regressione lineare
regression_model <- lm(Y ~ X, data=data)
RIn questo esempio eseguiamo una regressione lineare per modellare la relazione fra le variabili X
e Y
del frame di dati data
. Il comando lm()
serve a calcolare una regressione lineare in R. Il risultato della regressione viene memorizzato nella variabile regression_model
e può essere utilizzato per ulteriori analisi.
Filtraggio di dati con il pacchetto dplyr
filtered_data <- dplyr::filter(data, column > 10)
RIl comando dplyr::filter()
si trova nel pacchetto dplyr ed è utilizzato per la manipolazione dei dati. Il pacchetto dplyr offre potenti funzioni per il filtraggio dei dati. Otteniamo la variabile filtered_data
selezionando le righe dal frame di dati data
in cui il valore nella colonna column
è maggiore di 10.
Creazione di grafici quantile-quantile
qqnorm(data$Variable)
qqline(data$Variable)
RÈ possibile utilizzare qqnorm()
per creare un grafico quantile-quantile in R. In questo esempio viene tracciato un grafico quantile-quantile per la variabile Variable
ricavata da data
. Con qqline()
è possibile aggiungere una linea di riferimento per confrontare la distribuzione con una distribuzione normale.
Il nostro tutorial sulla programmazione in R è uno strumento consigliato per tutti coloro che stanno muovendo i primi passi in questo campo. In questo tutorial troverai moltissimi consigli e le basi di cui hai bisogno per entrare nel mondo della programmazione in R. Ulteriori consigli e nozioni fondamentali si trovano qui nella nostra guida generale “Imparare a programmare: iniziare dalle basi” all’interno della Digital Guide.