Come esportare dati da R
In questo tutorial impareremo come esportare i dati dall'ambiente R in diversi formati.
Per esportare i dati sul disco rigido, è necessario il percorso del file e un'estensione. Prima di tutto, il percorso è la posizione in cui verranno archiviati i dati. In questo tutorial vedrai come memorizzare i dati su:
- Il disco rigido
- Google Drive
- Dropbox
In secondo luogo, R consente agli utenti di esportare i dati in diversi tipi di file. Copriamo l'estensione del file essenziale:
- csv
- xlsx
- RDS
- SAS
- SPSS
- STATA
Nel complesso, non è difficile esportare i dati da R.
In questo tutorial imparerai-
- Esporta su disco rigido
- Come esportare un DataFrame in un file CSV in R
- Come esportare un dato da R a un file Excel
- Esportazione di dati da R a software diverso
- Esportazione di dati da R a file SAS
- Come esportare dati da R a file STATA
- Interagisci con i servizi cloud
- Google Drive
- Esporta su Dropbox
Esporta su disco rigido
Per cominciare, puoi salvare i dati direttamente nella directory di lavoro. Il codice seguente stampa il percorso della directory di lavoro:
directory <-getwd()directory
Produzione:
## [1] "/Users/15_Export_to_do"
Per impostazione predefinita, il file verrà salvato nel percorso seguente.
Per Mac OS:
/Users/USERNAME/Downloads/
Per Windows:
C:\Users\USERNAME\Documents\
Ovviamente puoi impostare un percorso diverso. Ad esempio, puoi modificare il percorso della cartella dei download.
Crea frame di dati
Prima di tutto, importiamo il set di dati mtcars e otteniamo la media di mpg e disp raggruppati per marcia.
library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df
Uscita ::
## # A tibble: 3 x 3## gear mean_mpg mean_disp##lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800
La tabella contiene tre righe e tre colonne. Puoi creare un file CSV con la funzione write.csv in R.
Come esportare un DataFrame in un file CSV in R
La sintassi di base di write.csv in R per esportare il DataFrame in CSV in R:
write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory
Esempio:
write.csv(df, "table_car.csv")
Spiegazione del codice
- write.csv (df, "table_car.csv"): crea un file CSV nel disco rigido:
- df: nome del data frame nell'ambiente
- "table_car.csv": Assegna un nome al file table_car e memorizzalo come csv
Nota : è possibile utilizzare la funzione write.csv in R come write.csv2 () per separare le righe con un punto e virgola per l'esportazione di R in dati csv.
write.csv2(df, "table_car.csv")
Nota : solo a scopo pedagogico, abbiamo creato una funzione chiamata open_folder () per aprire la cartella della directory per te. Hai solo bisogno di eseguire il codice qui sotto e vedere dove è archiviato il file csv. Dovresti vedere i nomi dei file table_car.csv per l'esportazione dei dati R in csv.
# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)
Come esportare un dato da R a un file Excel
Ora impareremo come esportare i dati da R a Excel:
Esportare dati da R a Excel è banale per gli utenti Windows e più complicato per gli utenti Mac OS. Entrambi gli utenti useranno la libreria xlsx per creare un file Excel. La leggera differenza deriva dall'installazione della libreria. Infatti, la libreria xlsx utilizza Java per creare il file. Java deve essere installato se non presente nella macchina per l'esportazione di Data R in Excel.
Utenti Windows
Se sei un utente Windows, puoi installare la libreria direttamente con conda per esportare dataframe in excel R:
conda install -c r r-xlsx
Una volta installata la libreria, puoi utilizzare la funzione write.xlsx (). Una nuova cartella di lavoro Excel viene creata nella directory di lavoro per l'esportazione R in dati Excel
library(xlsx)write.xlsx(df, "table_car.xlsx")
Se sei un utente Mac OS, devi seguire questi passaggi:
- Passaggio 1: installa l'ultima versione di Java
- Passaggio 2: installa la libreria rJava
- Passaggio 3: installa la libreria xlsx
Passaggio 1) È possibile scaricare Java dal sito Oracle ufficiale e installarlo.
Puoi tornare a Rstudio e controllare quale versione di Java è installata.
system("java -version")
Al momento del tutorial, l'ultima versione di Java è 9.0.4.
Passaggio 2) È necessario installare rjava in R. Ti consigliamo di installare R e Rstudio con Anaconda. Anaconda gestisce le dipendenze tra le librerie. In questo senso, Anaconda gestirà le complessità dell'installazione di rJava.
Prima di tutto, devi aggiornare conda e quindi installare la libreria. È possibile copiare e incollare le due righe di codice successive nel terminale.
conda - conda updateconda install -c r r-rjava
Quindi, apri rjava in Rstudio
library(rJava)
Passaggio 3) Infine, è il momento di installare xlsx. Ancora una volta, puoi usare conda per farlo:
conda install -c r r-xlsx
Proprio come gli utenti di Windows, puoi salvare i dati con la funzione write.xlsx ()
library(xlsx)
Produzione:
## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")
Esportazione di dati da R a software diverso
Esportare i dati in un software diverso è semplice come importarli. La libreria "haven" fornisce un modo conveniente per esportare i dati
- spss
- sas
- stata
Prima di tutto, importa la libreria. Se non hai "haven", puoi andare qui per installarlo.
library(haven)
File SPSS
Di seguito è riportato il codice per esportare i dati nel software SPSS:
write_sav(df, "table_car.sav")
Esportazione di dati da R a file SAS
Semplice come spss, puoi esportare in sas
write_sas(df, "table_car.sas7bdat")
Come esportare dati da R a file STATA
Infine, la libreria rifugio consente di scrivere file .dta.
write_dta(df, "table_car.dta")
R
Se vuoi salvare un data frame o qualsiasi altro oggetto R, puoi usare la funzione save ().
save(df, file ='table_car.RData')
Puoi controllare i file creati sopra nella directory di lavoro attuale
Interagisci con i servizi cloud
Ultimo ma non meno importante, R è dotato di fantastiche librerie per interagire con i servizi di cloud computing. L'ultima parte di questo tutorial riguarda l'esportazione / importazione di file da:
- Google Drive
- Dropbox
Nota : questa parte del tutorial presuppone che tu abbia un account con Google e Dropbox. In caso contrario, puoi crearne uno rapidamente per - Google Drive: https://accounts.google.com/SignUp?hl=it - Dropbox: https://www.dropbox.com/h
Google Drive
È necessario installare la libreria googledrive per accedere alla funzione che permette di interagire con Google Drive.
La libreria non è ancora disponibile su Anaconda. Puoi installarlo con il codice qui sotto nella console.
install.packages("googledrive")
e apri la libreria.
library(googledrive)
Per gli utenti non conda, l'installazione di una libreria è semplice, è possibile utilizzare la funzione install.packages ('NOME DEL PACCHETTO) con il nome del pacchetto tra parentesi. Non dimenticare il "". Notare che R dovrebbe installare automaticamente il pacchetto in `libPaths (). Vale la pena vederlo in azione.
Carica su Google Drive
Per caricare un file su Google drive, è necessario utilizzare la funzione drive_upload ().
Ogni volta che riavvii Rstudio, ti verrà chiesto di consentire l'accesso a tidyverse a Google Drive.
La sintassi di base di drive_upload () è
drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name.
Dopo aver avviato il codice, è necessario confermare diverse domande
drive_upload%<("table_car.csv", name ="table_car")
Produzione:
## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv
Si digita 1 nella console per confermare l'accesso
Quindi, verrai reindirizzato all'API di Google per consentire l'accesso. Fare clic su Consenti.
Una volta completata l'autenticazione, puoi chiudere il browser.
Nella console di Rstudio, puoi vedere il riepilogo del passaggio fatto. Google ha caricato correttamente il file che si trova localmente su Drive. Google ha assegnato un ID a ogni file nell'unità.
Puoi vedere questo file in Google Spreadsheet.
drive_browse("table_car")
Produzione:
Verrai reindirizzato a Google Spreadsheet
Importa da Google Drive
Carica un file da Google Drive con l'ID è conveniente. Se conosci il nome del file, puoi ottenere il suo ID come segue:
Nota : a seconda della tua connessione Internet e delle dimensioni del tuo Drive, ci vuole del tempo.
x <-drive_get("table_car")as_id(x)
Hai memorizzato l'ID nella variabile x. La funzione drive_download () consente di scaricare un file da Google Drive.
La sintassi di base è:
drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.
Puoi finalmente scaricare il file:
download_google & lt; - drive_download(as_id(x), overwrite = TRUE)
Spiegazione del codice
- drive_download (): funzione per scaricare un file da Google Drive
- as_id (x): utilizza l'ID per sfogliare il file in Google Drive
- overwrite = TRUE: Se il file esiste, sovrascriverlo, altrimenti l'esecuzione viene interrotta Per vedere il nome del file localmente, puoi usare:
Produzione:
Il file viene archiviato nella directory di lavoro. Ricorda, devi aggiungere l'estensione del file per aprirlo in R. Puoi creare il nome completo con la funzione paste () (cioè table_car.csv)
google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car
Produzione:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Infine, puoi rimuovere il file dal tuo Google Drive.
## remove filedrive_find("table_car") %>%drive_rm()
Produzione:
È un processo lento. Richiede tempo per eliminarli
Esporta su Dropbox
R interagisce con Dropbox tramite la libreria rdrop2. Anche la libreria non è disponibile ad Anaconda. Puoi installarlo tramite la console
install.packages('rdrop2')
library(rdrop2)
Devi fornire l'accesso temporaneo a Dropbox con le tue credenziali. Dopo l'identificazione, R può creare, rimuovere il caricamento e il download sul tuo Dropbox.
Prima di tutto, devi dare accesso al tuo account. Le credenziali vengono memorizzate nella cache durante tutta la sessione.
drop_auth()
Verrai reindirizzato a Dropbox per confermare l'autenticazione.
Riceverai una pagina di conferma. Puoi chiuderlo e tornare a R
Puoi creare una cartella con la funzione drop_create ().
- drop_create ('my_first_drop'): crea una cartella nel primo ramo di Dropbox
- drop_create ('First_branch / my_first_drop'): crea una cartella all'interno della cartella First_branch esistente.
drop_create('my_first_drop')
Produzione:
In DropBox
Per caricare il file .csv nel tuo Dropbox, utilizza la funzione drop_upload ().
Sintassi di base:
drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")
Produzione:
In DropBox
Puoi leggere il file csv da Dropbox con la funzione drop_read_csv ()
dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car
Produzione:
## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800
Quando hai finito di utilizzare il file e desideri eliminarlo. Devi scrivere il percorso del file nella funzione drop_delete ()
drop_delete('my_first_drop/table_car.csv')
Produzione:
È anche possibile eliminare una cartella
drop_delete('my_first_drop')
Produzione:
Sommario
Possiamo riassumere tutte le funzioni nella tabella sottostante
Biblioteca |
Obbiettivo |
Funzione |
---|---|---|
base |
Esporta CSV |
write.csv () |
xlsx |
Esporta in Excel |
write.xlsx () |
porto |
Esporta spss |
write_sav () |
porto |
Export sas |
write_sas () |
porto |
Esporta stata |
write_dta () |
base |
Esporta R |
Salva() |
Google Drive |
Carica Google Drive |
drive_upload () |
Google Drive |
Apri in Google Drive |
drive_browse () |
Google Drive |
Recupera ID file |
drive_get (as_id ()) |
Google Drive |
Scarica da Google Drive |
download_google () |
Google Drive |
Rimuovi file da Google Drive |
drive_rm () |
rdrop2 |
Autenticazione |
drop_auth () |
rdrop2 |
Crea una cartella |
drop_create () |
rdrop2 |
Carica su Dropbox |
drop_upload () |
rdrop2 |
Leggi csv da Dropbox |
drop_read_csv |
rdrop2 |
Elimina file da Dropbox |
drop_delete () |