Colab: un breve tutorial#

Questo tutorial fornisce una guida dettagliata su come importare un file da Google Drive in Colab.

Preparazione su Google Drive#

Per iniziare, è necessario effettuare alcune operazioni preliminari su Google Drive:

  1. Salvataggio dei file necessari: Accedi al tuo account Google Drive e salva i file di interesse, come un dataset e un Jupyter Notebook. Per esempio, potresti creare un Jupyter Notebook con Visual Studio Code e salvarlo con l’estensione .ipynb. In questo esempio, il file STAR.csv è stato salvato nella cartella drive/MyDrive/teaching/psicometria/2024.

  2. Posizionamento dei file: Assicurati di conoscere con precisione il percorso della cartella in cui hai salvato i tuoi file. È possibile salvare il notebook in qualsiasi cartella, ma è importante ricordare dove si trova. Nel nostro esempio, anche il notebook import_data.ipynb è stato salvato nella stessa cartella del dataset.

Collegamento a Google Colab#

Per collegare il tuo Google Drive a Colab, inserisci il seguente codice nella prima cella del tuo Jupyter Notebook su Colab:

from google.colab import drive
drive.mount('/content/drive')

Esegui questa cella per iniziare il processo di autenticazione. Ti verrà richiesto di inserire le tue credenziali (si consiglia di utilizzare l’account istituzionale) e di concedere i permessi necessari a Colab per accedere al tuo Drive.

Verifica del file#

Prima di procedere, è utile verificare che il file desiderato si trovi effettivamente nel percorso specificato. Usa un comando simile al seguente per elencare i file presenti nella cartella:

!ls drive/MyDrive/teaching/psicometria/2024

Se il comando mostra il file STAR.csv, significa che è presente nella cartella e pronto per essere utilizzato.

Importazione dei pacchetti e del dataset#

Prima di importare i dati, importa i pacchetti Python necessari per la tua analisi:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

Successivamente, puoi importare i dati direttamente dal file CSV specificando il percorso completo:

df = pd.read_csv("drive/MyDrive/teaching/psicometria/2024/STAR.csv")

È fondamentale usare il percorso completo dal punto di montaggio drive fino al nome del file. Il percorso varierà a seconda dell’utente e della struttura del suo Drive.

Visualizzazione dei dati#

Con i dati ora disponibili in df, puoi procedere con l’analisi. Per esempio, per creare un istogramma della variabile reading, puoi usare il seguente codice:

_ = sns.histplot(data=df, x="reading", stat='density')

Questo ti permetterà di visualizzare la distribuzione dei dati relativi alla lettura nel dataset STAR.csv.

Seguendo questi passaggi, puoi facilmente lavorare con i file salvati su Google Drive direttamente all’interno di un Jupyter Notebook su Google Colab.