Colab: un breve tutorial#
Questo tutorial fornisce una guida dettagliata su come importare un file da Google Drive in Colab.
Preparazione su Google Drive#
Per iniziare, è necessario effettuare alcune operazioni preliminari su Google Drive:
Salvataggio dei file necessari: Accedi al tuo account Google Drive e salva i file di interesse, come un dataset e un Jupyter Notebook. Per esempio, potresti creare un Jupyter Notebook con Visual Studio Code e salvarlo con l’estensione
.ipynb
. In questo esempio, il fileSTAR.csv
è stato salvato nella cartelladrive/MyDrive/teaching/psicometria/2024
.Posizionamento dei file: Assicurati di conoscere con precisione il percorso della cartella in cui hai salvato i tuoi file. È possibile salvare il notebook in qualsiasi cartella, ma è importante ricordare dove si trova. Nel nostro esempio, anche il notebook
import_data.ipynb
è stato salvato nella stessa cartella del dataset.
Collegamento a Google Colab#
Per collegare il tuo Google Drive a Colab, inserisci il seguente codice nella prima cella del tuo Jupyter Notebook su Colab:
from google.colab import drive
drive.mount('/content/drive')
Esegui questa cella per iniziare il processo di autenticazione. Ti verrà richiesto di inserire le tue credenziali (si consiglia di utilizzare l’account istituzionale) e di concedere i permessi necessari a Colab per accedere al tuo Drive.
Verifica del file#
Prima di procedere, è utile verificare che il file desiderato si trovi effettivamente nel percorso specificato. Usa un comando simile al seguente per elencare i file presenti nella cartella:
!ls drive/MyDrive/teaching/psicometria/2024
Se il comando mostra il file STAR.csv
, significa che è presente nella cartella e pronto per essere utilizzato.
Importazione dei pacchetti e del dataset#
Prima di importare i dati, importa i pacchetti Python necessari per la tua analisi:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
Successivamente, puoi importare i dati direttamente dal file CSV specificando il percorso completo:
df = pd.read_csv("drive/MyDrive/teaching/psicometria/2024/STAR.csv")
È fondamentale usare il percorso completo dal punto di montaggio drive
fino al nome del file. Il percorso varierà a seconda dell’utente e della struttura del suo Drive.
Visualizzazione dei dati#
Con i dati ora disponibili in df
, puoi procedere con l’analisi. Per esempio, per creare un istogramma della variabile reading
, puoi usare il seguente codice:
_ = sns.histplot(data=df, x="reading", stat='density')
Questo ti permetterà di visualizzare la distribuzione dei dati relativi alla lettura nel dataset STAR.csv
.
Seguendo questi passaggi, puoi facilmente lavorare con i file salvati su Google Drive direttamente all’interno di un Jupyter Notebook su Google Colab.