21 июля 2017 г.
На этой неделе команда Яндекса сообщила о появлении нового метода машинного обучения, который получил название CatBoost. Чем он отличается от Матрикснета и как повлияет на результаты органической выдачи в Яндексе?
Метод машинного обучения Матрикснет, который использует Яндекс с 2009 года, позволяет учитывать при ранжировании множество самых разных факторов и их комбинаций. Именно с помощью этого метода строится формула ранжирования Яндекса.
Но если старый метод отлично справляется со своей задачей, зачем понадобилось разрабатывать новый?
Catboost так же, как и Matrixnet использует градиентный бустинг — механизм, который позволяет работать с разнородными данными. Однако есть и существенные отличия:
Яндекс заявил, что в скором времени, как только завершатся все эксперименты, CatBoost, скорее всего, полностью заменит Матрикснет.
На данный момент в режиме тестирования метод обучения CatBoost используется на двух сервисах Яндекса — Дзен и Погода. В дальнейшем планируется применить его и для поиска, ведь уже сейчас новый метод показал себя лучше Matrixnet по всем параметрам.
Примечательно и то, что библиотека CatBoost есть в открытом доступе. Она доступна сразу на двух языках программирования — Python и R. Новое машинное обучение начинает внедряться в самые разные сферы. Например, его уже активно используют в ЦЕРН — Европейском центре ядерных исследований — для экспериментов с адронным коллайдером.
Как повлияет CatBoost на выдачу в поиске Яндекса, когда разработчики закончат этап тестирования, и заменят Матрикснет? Пока что сложно делать однозначные выводы, ведь, скорее всего, процесс внедрения будет постепенным. Поисковая выдача должна стать более качественной, что облегчит работу SEO-специалистам и, самое главное, позволит пользователям еще быстрее находить нужную информацию, товары и услуги.