Cześć,
Dopiero rozpoczynam przygodę z programowaniem w Pythonie. Na chwilę obecną mam dwa problemy podczas pisania kodu.
1) Jak podzielić informacje w kolumnie, jeśli znajduje się tam kilka wartości?
Próbuję dane rozdzielić w następujący sposób:
def spliting(col_name):
spliting = df[col_name].str.cat(sep = '|')
spliting = pd.Series(spliting .split('|'))
director = spliting('director')
df.director.value_counts()
Otrzymuję natomiast następujący wynik:
John Carpenter 12
Steven Spielberg 11
..
Peter Webber 1
Ethan Coen|Joel Coen 1
Ari Sandel 1
Dean Israelite 1
Zgodnie z powyższym, dalej występują dwie wartości/dane przedzielone znakiem "|".
Jak tego uniknąć?
2) Jak wydrukować zarówno przychód jak i dane reżysera przy jednoczesnym posortowaniu od największego zysku?
df['income'] = (df.revenue_adj * df.budget_adj)
q1 = df.groupby('director').income.sum()
q1
Powyższy kod zwraca mi zarówno reżysera i przychód nie potrafię jednak wyciągnąć informacji o najbardziej dochodowym reżyserze.movies.zip