✏️ Esercizi#
Exercise 23
Scrivi le istruzioni Pandas per selezionare, dal set di dati penguins.csv
, le osservazioni in cui bill_depth_mm
>= 18.7, considerando solo i pinguini dell’isola Dream. Dopo avere importato i dati, si eliminino i valori mancanti.
Solution to Exercise 23
import numpy as np
import pandas as pd
df = pd.read_csv('data/penguins.csv')
df.dropna(inplace=True)
df[(df["bill_depth_mm"] >= 18.7) & (df["island"] == "Dream")].head(10)
Exercise 24
Scrivi le istruzioni Pandas per selezionare, dal set di dati penguins.csv
, le prime 5 osservazioni della specie Chinstrap, considerando solo quelli pinguini sull’isola Torgersen di sesso femminile. Dopo avere importato i dati, si eliminino i valori mancanti.
Solution to Exercise 24
import numpy as np
import pandas as pd
df = pd.read_csv('data/penguins.csv')
df.dropna(inplace=True)
temp = df[(df["species"] == "Chinstrap") & (df["island"] == "Dream") & (df["sex"] == "female")]
temp.iloc[1::5]
Exercise 25
Si trovi la media, la deviazione standard e la numerosità delle osservazioni bill_length_mm
per i pinguini di sesso maschile della specie Chinstrap che si trovano sull’isola Dream. Dopo avere importato i dati, si eliminino i valori mancanti.
Solution to Exercise 25
import numpy as np
import pandas as pd
df = pd.read_csv('data/penguins.csv')
df.dropna(inplace=True)
summary_stats = (
df.loc[:, ["island", "species", "sex", "bill_length_mm"]]
.groupby(["island", "species", "sex"])
.aggregate(["mean", "std", "count"])
)
summary_stats