Untitled

From Crippled Prairie Dog, 5 Months ago, written in Plain Text, viewed 94 times.
URL http://codebin.org/view/83d7e8c8 Embed
Download Paste or View Raw
  1. import pandas as pd
  2. import datetime as dt
  3.  
  4. data = pd.read_csv('/datasets/data_for_tasks_3.csv', sep=',')
  5. data['date'] = data['date'].map(lambda x: dt.datetime.strptime(x, '%d/%m/%Y'))
  6.  
  7. print(data.head(5))
  8.  
  9. ordersByUsers = (
  10.     data.groupby('userId', as_index=False)
  11.     .agg({'orderId': 'nunique'})
  12. )
  13.  
  14. ordersByUsers.columns = ['userId', 'orders']
  15.  
  16. print(ordersByUsers.sort_values(by='orders', ascending=False).head(10))
  17.  
  18. # Метод .groupby('...', as_index=False) сгруппирует заказы по пользователям
  19. # Метод .agg({'...' : 'nunique',}) подсчитает число уникальных заказов по сгруппированным данным
  20. # Метод .sort_values(by='...',ascending=False) отсортирует датафрейм по значению в столбце

Reply to "Untitled"

Here you can reply to the paste above