import pandas as pd
from sklearn.tree import DecisionTreeRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_squared_error
df = pd.read_csv('/datasets/train_data.csv')
from sklearn.tree import DecisionTreeClassifier
from sklearn.metrics import mean_squared_error
features = df.drop(['last_price'], axis=1)
target = df['last_price'] / 1000000
features_train, features_valid, target_train, target_valid = train_test_split(
features, target, test_size=0.25, random_state=12345) # отделите 25% данных для валидационной выборки
best_model = None
best_result = 10000
best_depth = 0
for depth in range(1, 6):
# инициализируйте модель DecisionTreeRegressor с параметром random_state=12345 и max_depth=depth
model = DecisionTreeClassifier(random_state=12345, max_depth=depth)
# обучите модель на тренировочной выборке
model.fit(features_train, target_train)
# получите предсказания модели на валидационной выборке
predictions_valid = model.predict(features_valid)
# посчитайте значение метрики rmse на валидационной выборке
result = mean_squared_error(target_valid, predictions_valid)**0.5
if result < best_result:
best_model = model
best_result = result
best_depth = depth
print("RMSE наилучшей модели на валидационной выборке:", best_result, "Глубина дерева:", best_depth)
#сцылко на задачку
# https://practicum.yandex.ru/trainer/data-scientist/lesson/ff0b4597-a6fb-49df-b52d-b0ff0578c5bf/task/89ccb93a-4889-407e-97e5-7017ddbaf8a4/?hideTheory=1
#Вот таккая ошибка
#Traceback (most recent call last):
# File "main.py", line 23, in <module>
#ValueError: Unknown label type: 'continuous'