- df_train=pd.read_csv('/datasets/gold_industry_train.csv')
- df_test=pd.read_csv('/datasets/gold_industry_test.csv')
- df_full=pd.read_csv('/datasets/gold_industry_full.csv')
- # Преобразуем колонку date в формат datetime
- df_train['date'] = pd.to_datetime(df_train['date'])
- df_test['date'] = pd.to_datetime(df_test['date'])
- df_full['date'] = pd.to_datetime(df_full['date'])
- # Сделаем колонку date индексом датафрейма
- df_train = df_train.set_index('date')
- df_test = df_test.set_index('date')
- df_full = df_full.set_index('date')
- # Добавим целевые признаки в df_test
- # Выбираем только нужные столбцы из df_full
- df_target = df_full[['rougher.output.recovery', 'final.output.recovery']]
- df_test = df_test.join(df_target)
- df_test[['rougher.output.recovery', 'final.output.recovery']]
- df_full.loc[df_test.index,['rougher.output.recovery', 'final.output.recovery']]