Untitled

From Сергей, 2 Months ago, written in Plain Text, viewed 43 times. This paste will die in 1 Second.
URL http://codebin.org/view/3564394b Embed
Download Paste or View Raw
  1. def genre_weekday(df, day, time1, time2):
  2.     # последовательная фильтрация
  3.     # оставляем в genre_df только те строки df, у которых день равен day
  4.     genre_df = df[df['day'] == day]
  5.     # оставляем в genre_df только те строки genre_df, у которых время меньше time2
  6.     genre_df = genre_df[genre_df['time'] < time2]
  7.     # оставляем в genre_df только те строки genre_df, у которых время больше time1
  8.     genre_df = genre_df[genre_df['time'] > time1]
  9.     # сгруппируем отфильтрованный датафрейм по столбцу с названиями жанров, возьмём столбец genre и посчитаем кол-во строк для каждого жанра методом count()
  10.     genre_df_grouped = genre_df.groupby('genre')['time'].count()
  11.     # отсортируем результат по убыванию (чтобы в начале Series оказались самые популярные жанры)
  12.     genre_df_sorted = genre_df_grouped.sort_values(ascending=False)
  13.     # вернём Series с 10 самыми популярными жанрами в указанный отрезок времени заданного дня
  14.     return genre_df_sorted[:10]

Reply to "Untitled"

Here you can reply to the paste above