Дерево решений в регрессии

From Trollen Goblinson, 2 Months ago, written in Python, viewed 146 times. This paste will check out in 1 Second.
URL http://codebin.org/view/78f6f02c Embed
Download Paste or View Raw
  1. import pandas as pd
  2. from sklearn.tree import DecisionTreeRegressor
  3. from sklearn.model_selection import train_test_split
  4. from sklearn.metrics import mean_squared_error
  5.  
  6. df = pd.read_csv('/datasets/train_data.csv')
  7. from sklearn.tree import DecisionTreeClassifier
  8. from sklearn.metrics import mean_squared_error
  9.  
  10. features = df.drop(['last_price'], axis=1)
  11. target = df['last_price'] / 1000000
  12.  
  13. features_train, features_valid, target_train, target_valid = train_test_split(
  14.     features, target, test_size=0.25, random_state=12345) # отделите 25% данных для валидационной выборки
  15.  
  16. best_model = None
  17. best_result = 10000
  18. best_depth = 0
  19. for depth in range(1, 6):
  20.     # инициализируйте модель DecisionTreeRegressor с параметром random_state=12345 и max_depth=depth
  21.     model = DecisionTreeClassifier(random_state=12345, max_depth=depth)
  22.     # обучите модель на тренировочной выборке
  23.     model.fit(features_train, target_train)
  24.     # получите предсказания модели на валидационной выборке
  25.     predictions_valid = model.predict(features_valid)
  26.    
  27.     # посчитайте значение метрики rmse на валидационной выборке
  28.     result = mean_squared_error(target_valid, predictions_valid)**0.5
  29.     if result < best_result:
  30.         best_model = model
  31.         best_result = result
  32.         best_depth = depth
  33.  
  34. print("RMSE наилучшей модели на валидационной выборке:", best_result, "Глубина дерева:", best_depth)
  35.  
  36. #сцылко на задачку
  37. # https://practicum.yandex.ru/trainer/data-scientist/lesson/ff0b4597-a6fb-49df-b52d-b0ff0578c5bf/task/89ccb93a-4889-407e-97e5-7017ddbaf8a4/?hideTheory=1
  38. #Вот таккая ошибка
  39. #Traceback (most recent call last):
  40. #  File "main.py", line 23, in <module>
  41.  
  42. #ValueError: Unknown label type: 'continuous'
  43.  

Reply to "Дерево решений в регрессии"

Here you can reply to the paste above