Обязанности:
Data Scientist
Extract - выборка данных из DWH на SQL или NonSQL.
Transform - Визуализация и тестирование данных на multicollinearity, heteroscedacity, autoсorrelation и endogeneity.Feature extraction (нахождение предикторов, RFE и stepforward, stepwise методы).
Разделение выборок на обучающую и тестовую.
Регрессии аналитические (LM, GLM, ivreg и тд), итерационные (GBM, XGBDart, NN и пр.), классификация (Логит и пробит модели, GLM, SVM, C5.0, RandomForest, GBM, XGB, LightGBM и тд.), кластеризация (k-means, KNN, HC). Проверки CV, параметризация bagging, boosting.
Оценка коэф. тесты на адекватность данным, показатели (RSS, R2, AIC, BIC- для количественных, ROC/AUC и Gini для качественных моделей, проверка гипотез)
Load - выгрузка результатов и визуализации в EXCEL, SQL, HTML.