Esportazione di dati da R: come esportare dati da R a CSV, Excel

Sommario:

Anonim

Come esportare dati da R

In questo tutorial impareremo come esportare i dati dall'ambiente R in diversi formati.

Per esportare i dati sul disco rigido, è necessario il percorso del file e un'estensione. Prima di tutto, il percorso è la posizione in cui verranno archiviati i dati. In questo tutorial vedrai come memorizzare i dati su:

  • Il disco rigido
  • Google Drive
  • Dropbox

In secondo luogo, R consente agli utenti di esportare i dati in diversi tipi di file. Copriamo l'estensione del file essenziale:

  • csv
  • xlsx
  • RDS
  • SAS
  • SPSS
  • STATA

Nel complesso, non è difficile esportare i dati da R.

In questo tutorial imparerai-

  • Esporta su disco rigido
  • Come esportare un DataFrame in un file CSV in R
  • Come esportare un dato da R a un file Excel
  • Esportazione di dati da R a software diverso
  • Esportazione di dati da R a file SAS
  • Come esportare dati da R a file STATA
  • Interagisci con i servizi cloud
  • Google Drive
  • Esporta su Dropbox

Esporta su disco rigido

Per cominciare, puoi salvare i dati direttamente nella directory di lavoro. Il codice seguente stampa il percorso della directory di lavoro:

directory <-getwd()directory

Produzione:

## [1] "/Users/15_Export_to_do" 

Per impostazione predefinita, il file verrà salvato nel percorso seguente.

Per Mac OS:

/Users/USERNAME/Downloads/ 

Per Windows:

C:\Users\USERNAME\Documents\

Ovviamente puoi impostare un percorso diverso. Ad esempio, puoi modificare il percorso della cartella dei download.

Crea frame di dati

Prima di tutto, importiamo il set di dati mtcars e otteniamo la media di mpg e disp raggruppati per marcia.

library(dplyr)df <-mtcars % > %select(mpg, disp, gear) % > %group_by(gear) % > %summarize(mean_mpg = mean(mpg), mean_disp = mean(disp))df

Uscita ::

## # A tibble: 3 x 3## gear mean_mpg mean_disp##   lt;dbl>## 1 3 16.10667 326.3000## 2 4 24.53333 123.0167## 3 5 21.38000 202.4800

La tabella contiene tre righe e tre colonne. Puoi creare un file CSV con la funzione write.csv in R.

Come esportare un DataFrame in un file CSV in R

La sintassi di base di write.csv in R per esportare il DataFrame in CSV in R:

write.csv(df, path)arguments-df: Dataset to save. Need to be the same name of the data frame in the environment.-path: A string. Set the destination path. Path + filename + extension i.e. "/Users/USERNAME/Downloads/mydata.csv" or the filename + extension if the folder is the same as the working directory

Esempio:

write.csv(df, "table_car.csv")

Spiegazione del codice

  • write.csv (df, "table_car.csv"): crea un file CSV nel disco rigido:
    • df: nome del data frame nell'ambiente
    • "table_car.csv": Assegna un nome al file table_car e memorizzalo come csv

Nota : è possibile utilizzare la funzione write.csv in R come write.csv2 () per separare le righe con un punto e virgola per l'esportazione di R in dati csv.

write.csv2(df, "table_car.csv")

Nota : solo a scopo pedagogico, abbiamo creato una funzione chiamata open_folder () per aprire la cartella della directory per te. Hai solo bisogno di eseguire il codice qui sotto e vedere dove è archiviato il file csv. Dovresti vedere i nomi dei file table_car.csv per l'esportazione dei dati R in csv.

# Run this code to create the functionopen_folder <-function(dir){if (.Platform['OS.type'] == "windows"){shell.exec(dir)} else {system(paste(Sys.getenv("R_BROWSER"), dir))}}# Call the function to open the folderopen_folder(directory)

Come esportare un dato da R a un file Excel

Ora impareremo come esportare i dati da R a Excel:

Esportare dati da R a Excel è banale per gli utenti Windows e più complicato per gli utenti Mac OS. Entrambi gli utenti useranno la libreria xlsx per creare un file Excel. La leggera differenza deriva dall'installazione della libreria. Infatti, la libreria xlsx utilizza Java per creare il file. Java deve essere installato se non presente nella macchina per l'esportazione di Data R in Excel.

Utenti Windows

Se sei un utente Windows, puoi installare la libreria direttamente con conda per esportare dataframe in excel R:

conda install -c r r-xlsx

Una volta installata la libreria, puoi utilizzare la funzione write.xlsx (). Una nuova cartella di lavoro Excel viene creata nella directory di lavoro per l'esportazione R in dati Excel

library(xlsx)write.xlsx(df, "table_car.xlsx")

Se sei un utente Mac OS, devi seguire questi passaggi:

  • Passaggio 1: installa l'ultima versione di Java
  • Passaggio 2: installa la libreria rJava
  • Passaggio 3: installa la libreria xlsx

Passaggio 1) È possibile scaricare Java dal sito Oracle ufficiale e installarlo.

Puoi tornare a Rstudio e controllare quale versione di Java è installata.

system("java -version")

Al momento del tutorial, l'ultima versione di Java è 9.0.4.

Passaggio 2) È necessario installare rjava in R. Ti consigliamo di installare R e Rstudio con Anaconda. Anaconda gestisce le dipendenze tra le librerie. In questo senso, Anaconda gestirà le complessità dell'installazione di rJava.

Prima di tutto, devi aggiornare conda e quindi installare la libreria. È possibile copiare e incollare le due righe di codice successive nel terminale.

conda - conda updateconda install -c r r-rjava

Quindi, apri rjava in Rstudio

library(rJava)

Passaggio 3) Infine, è il momento di installare xlsx. Ancora una volta, puoi usare conda per farlo:

conda install -c r r-xlsx

Proprio come gli utenti di Windows, puoi salvare i dati con la funzione write.xlsx ()

library(xlsx)

Produzione:

## Loading required package: xlsxjars
write.xlsx(df, "table_car.xlsx")

Esportazione di dati da R a software diverso

Esportare i dati in un software diverso è semplice come importarli. La libreria "haven" fornisce un modo conveniente per esportare i dati

  • spss
  • sas
  • stata

Prima di tutto, importa la libreria. Se non hai "haven", puoi andare qui per installarlo.

library(haven) 

File SPSS

Di seguito è riportato il codice per esportare i dati nel software SPSS:

write_sav(df, "table_car.sav") 

Esportazione di dati da R a file SAS

Semplice come spss, puoi esportare in sas

write_sas(df, "table_car.sas7bdat")

Come esportare dati da R a file STATA

Infine, la libreria rifugio consente di scrivere file .dta.

write_dta(df, "table_car.dta")

R

Se vuoi salvare un data frame o qualsiasi altro oggetto R, puoi usare la funzione save ().

save(df, file ='table_car.RData')

Puoi controllare i file creati sopra nella directory di lavoro attuale

Interagisci con i servizi cloud

Ultimo ma non meno importante, R è dotato di fantastiche librerie per interagire con i servizi di cloud computing. L'ultima parte di questo tutorial riguarda l'esportazione / importazione di file da:

  • Google Drive
  • Dropbox

Nota : questa parte del tutorial presuppone che tu abbia un account con Google e Dropbox. In caso contrario, puoi crearne uno rapidamente per - Google Drive: https://accounts.google.com/SignUp?hl=it - Dropbox: https://www.dropbox.com/h

Google Drive

È necessario installare la libreria googledrive per accedere alla funzione che permette di interagire con Google Drive.

La libreria non è ancora disponibile su Anaconda. Puoi installarlo con il codice qui sotto nella console.

install.packages("googledrive") 

e apri la libreria.

library(googledrive)

Per gli utenti non conda, l'installazione di una libreria è semplice, è possibile utilizzare la funzione install.packages ('NOME DEL PACCHETTO) con il nome del pacchetto tra parentesi. Non dimenticare il "". Notare che R dovrebbe installare automaticamente il pacchetto in `libPaths (). Vale la pena vederlo in azione.

Carica su Google Drive

Per caricare un file su Google drive, è necessario utilizzare la funzione drive_upload ().

Ogni volta che riavvii Rstudio, ti verrà chiesto di consentire l'accesso a tidyverse a Google Drive.

La sintassi di base di drive_upload () è

drive_upload(file, path = NULL, name = NULL)arguments:- file: Full name of the file to upload (i.e., including the extension)- path: Location of the file- name: You can rename it as you wish. By default, it is the local name. 

Dopo aver avviato il codice, è necessario confermare diverse domande

drive_upload%<("table_car.csv", name ="table_car")

Produzione:

## Local file:## * table_car.csv## uploaded into Drive file:## * table_car: 1hwb57eT-9qSgDHt9CrVt5Ht7RHogQaMk## with MIME type:## * text/csv

Si digita 1 nella console per confermare l'accesso

Quindi, verrai reindirizzato all'API di Google per consentire l'accesso. Fare clic su Consenti.

Una volta completata l'autenticazione, puoi chiudere il browser.

Nella console di Rstudio, puoi vedere il riepilogo del passaggio fatto. Google ha caricato correttamente il file che si trova localmente su Drive. Google ha assegnato un ID a ogni file nell'unità.

Puoi vedere questo file in Google Spreadsheet.

drive_browse("table_car")

Produzione:

Verrai reindirizzato a Google Spreadsheet

Importa da Google Drive

Carica un file da Google Drive con l'ID è conveniente. Se conosci il nome del file, puoi ottenere il suo ID come segue:

Nota : a seconda della tua connessione Internet e delle dimensioni del tuo Drive, ci vuole del tempo.

x <-drive_get("table_car")as_id(x)

Hai memorizzato l'ID nella variabile x. La funzione drive_download () consente di scaricare un file da Google Drive.

La sintassi di base è:

drive_download(file, path = NULL, overwrite = FALSE)arguments:- file: Name or id of the file to download-path: Location to download the file. By default, it is downloaded to the working directory and the name as in Google Drive-overwrite = FALSE: If the file already exists, don't overwrite it. If set to TRUE, the old file is erased and replaced by the new one.

Puoi finalmente scaricare il file:

download_google & lt; - drive_download(as_id(x), overwrite = TRUE)

Spiegazione del codice

  • drive_download (): funzione per scaricare un file da Google Drive
  • as_id (x): utilizza l'ID per sfogliare il file in Google Drive
  • overwrite = TRUE: Se il file esiste, sovrascriverlo, altrimenti l'esecuzione viene interrotta Per vedere il nome del file localmente, puoi usare:

Produzione:

Il file viene archiviato nella directory di lavoro. Ricorda, devi aggiungere l'estensione del file per aprirlo in R. Puoi creare il nome completo con la funzione paste () (cioè table_car.csv)

google_file <-download_google$local_pathgoogle_filepath <-paste(google_file, ".csv", sep = "")google_table_car <-read.csv(path)google_table_car

Produzione:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Infine, puoi rimuovere il file dal tuo Google Drive.

## remove filedrive_find("table_car") %>%drive_rm()

Produzione:

È un processo lento. Richiede tempo per eliminarli

Esporta su Dropbox

R interagisce con Dropbox tramite la libreria rdrop2. Anche la libreria non è disponibile ad Anaconda. Puoi installarlo tramite la console

install.packages('rdrop2')
library(rdrop2)

Devi fornire l'accesso temporaneo a Dropbox con le tue credenziali. Dopo l'identificazione, R può creare, rimuovere il caricamento e il download sul tuo Dropbox.

Prima di tutto, devi dare accesso al tuo account. Le credenziali vengono memorizzate nella cache durante tutta la sessione.

drop_auth()

Verrai reindirizzato a Dropbox per confermare l'autenticazione.

Riceverai una pagina di conferma. Puoi chiuderlo e tornare a R

Puoi creare una cartella con la funzione drop_create ().

  • drop_create ('my_first_drop'): crea una cartella nel primo ramo di Dropbox
  • drop_create ('First_branch / my_first_drop'): crea una cartella all'interno della cartella First_branch esistente.
drop_create('my_first_drop')

Produzione:

In DropBox

Per caricare il file .csv nel tuo Dropbox, utilizza la funzione drop_upload ().

Sintassi di base:

drop_upload(file, path = NULL, mode = "overwrite")arguments:- file: local path- path: Path on Dropbox- mode = "overwrite": By default, overwrite an existing file. If set to `add`, the upload is not completed.
drop_upload('table_car.csv', path = "my_first_drop")

Produzione:

In DropBox

Puoi leggere il file csv da Dropbox con la funzione drop_read_csv ()

dropbox_table_car <-drop_read_csv("my_first_drop/table_car.csv")dropbox_table_car

Produzione:

## X gear mean_mpg mean_disp## 1 1 3 16.10667 326.3000## 2 2 4 24.53333 123.0167## 3 3 5 21.38000 202.4800

Quando hai finito di utilizzare il file e desideri eliminarlo. Devi scrivere il percorso del file nella funzione drop_delete ()

drop_delete('my_first_drop/table_car.csv')

Produzione:

È anche possibile eliminare una cartella

drop_delete('my_first_drop')

Produzione:

Sommario

Possiamo riassumere tutte le funzioni nella tabella sottostante

Biblioteca

Obbiettivo

Funzione

base

Esporta CSV

write.csv ()

xlsx

Esporta in Excel

write.xlsx ()

porto

Esporta spss

write_sav ()

porto

Export sas

write_sas ()

porto

Esporta stata

write_dta ()

base

Esporta R

Salva()

Google Drive

Carica Google Drive

drive_upload ()

Google Drive

Apri in Google Drive

drive_browse ()

Google Drive

Recupera ID file

drive_get (as_id ())

Google Drive

Scarica da Google Drive

download_google ()

Google Drive

Rimuovi file da Google Drive

drive_rm ()

rdrop2

Autenticazione

drop_auth ()

rdrop2

Crea una cartella

drop_create ()

rdrop2

Carica su Dropbox

drop_upload ()

rdrop2

Leggi csv da Dropbox

drop_read_csv

rdrop2

Elimina file da Dropbox

drop_delete ()