Skip to content

Jupyter тетрадка с решением Kaggle соревнования Leopard Classification Challenge

Notifications You must be signed in to change notification settings

mark-narusov/kaggle_leopard_challenge

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 

Repository files navigation

kaggle_leopard_challenge

Ноутбук для Kaggle InClass соревнования по бинарной классификации для студентов курса Data Science с Глебом Михайловым.

Задача — предсказать курит человек или нет по его клиническим данным. Целевая метрика — F1-мера.

На 30-07-2023 это решение сидит на первом месте на лидерборде.

Используемые алгоритмы и инструменты:

  1. Feature Engineering с помощью доменных знаний и автоматической генерацией признаков (sklearn.preprocessing.PolynomialFeatures).
  2. Подбор гиперпараметров случайного леса и градиентного бустинга (CatBoost) с помощью Optuna.
  3. Подбор оптимальных порогов классификации лучших моделей для F1-меры.
  4. Блендинг предсказаний вероятностей моделей с заданным коэффициентом.

About

Jupyter тетрадка с решением Kaggle соревнования Leopard Classification Challenge

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published