- def genre_weekday(df, day, time1, time2):
- # последовательная фильтрация
- # оставляем в genre_df только те строки df, у которых день равен day
- genre_df = df[df['day'] == day]
- # оставляем в genre_df только те строки genre_df, у которых время меньше time2
- genre_df = genre_df[genre_df['time'] < time2]
- # оставляем в genre_df только те строки genre_df, у которых время больше time1
- genre_df = genre_df[genre_df['time'] > time1]
- # сгруппируем отфильтрованный датафрейм по столбцу с названиями жанров, возьмём столбец genre и посчитаем кол-во строк для каждого жанра методом count()
- genre_df_grouped = genre_df.groupby('genre')['time'].count()
- # отсортируем результат по убыванию (чтобы в начале Series оказались самые популярные жанры)
- genre_df_sorted = genre_df_grouped.sort_values(ascending=False)
- # вернём Series с 10 самыми популярными жанрами в указанный отрезок времени заданного дня
- return genre_df_sorted[:10]
Untitled
From Сергей, 2 Months ago, written in Plain Text, viewed 43 times.
This paste will die in 1 Second.
URL http://codebin.org/view/3564394b
Embed
Download Paste or View Raw
— Expand Paste to full width of browser