Untitled

From Fiery Shama, 10 Months ago, written in Plain Text, viewed 104 times.
URL http://codebin.org/view/7fab9983 Embed
Download Paste or View Raw
  1. # для детального анализа кофеен отфильтруем и сохраним данные в переменной coffee
  2. coffee = df.loc[df['category'] == 'кофейня']
  3.  
  4.  
  5. '''Построим сводную таблицу, показывающую статистические характеристики заведений кофеен по каждому административному округу Москвы. В этой сводной таблице мы исключаем значения, признанные выбросами на # этапе предобработки данных.'''
  6.  
  7. (
  8.     coffee.query("middle_coffee_cup<=400 and seats<=295").groupby('district')
  9.     .agg({
  10.         'name': 'count',
  11.         'middle_coffee_cup': ['mean', 'median', 'min', 'max'],
  12.         'rating': ['mean', 'median', 'min', 'max'],
  13.         'seats' : ['mean', 'median', 'min', 'max']
  14.     })
  15.     .sort_values(by=('name', 'count'), ascending=False)
  16. )
  17.  
  18. #метод замены пропусков.
  19. for t in df['name'].unique():
  20.     df.loc[(df['name'] == t) & (df['middle_coffee_cup'].isna()), 'middle_coffee_cup'] = \
  21.     df.loc[(df['name'] == t), 'middle_coffee_cup'].median()

Reply to "Untitled"

Here you can reply to the paste above