- import pandas as pd
- from pyod.models.knn import KNN
- from sklearn.ensemble import IsolationForest
- RANDOM_STATE = 42
- df = pd.read_csv('/datasets/sales.csv')
- data = df[['Sales', 'Profit']]
- # < напишите код здесь >
- model = KNN()
- estimation_knn = model.fit_predict(data == 1) # < напишите код здесь >
- outliers_knn = estimation_knn.sum() # < напишите код здесь >
- print("Количество аномалий (KNN): ", outliers_knn) # < напишите код здесь >)
- # < напишите код здесь >
- model = IsolationForest(n_estimators=100, random_state=RANDOM_STATE)
- estimation_iforest = model.fit_predict(data == -1) # < напишите код здесь >
- outliers_iforest = estimation_iforest.sum() # < напишите код здесь >
- print("Количество аномалий (изоляционный лес): ", outliers_iforest) # < напишите код здесь >)
- print("Совпало: ", (estimation_knn & estimation_iforest).sum() ) # < напишите код здесь >)