Исследовательская лаборатория Yandex Research представила инновационную нейросетевую архитектуру под названием TabM, предназначенную для работы с табличными данными.

Эта технология обеспечивает быструю обработку больших объемов информации и позволяет строить высокоточные прогнозы, что делает её востребованной в бизнесе, научных исследованиях и медицине.

Разработка была опробована на платформе Kaggle, известной своими международными соревнованиями по анализу данных и машинному обучению, организованными Google.

В частности, TabM использовалась для прогнозирования выживаемости пациентов после трансплантации костного мозга.

Название TabM расшифровывается как “Tabular DL model that makes Multiple predictions” и представляет собой ансамбль моделей, где каждая модель проводит свой анализ, а итоговый прогноз получается путем усреднения результатов.

В Яндексе отметили, что по итогам тестирования на 46 наборах данных TabM показала лучшие результаты по сравнению с другими решениями, заняв в среднем 1,7 место против 2,9 у ближайшего конкурента.

Кроме того, она продемонстрировала высокую стабильность работы, что особенно важно для практического применения.

Благодаря способности объединять усилия нескольких подмоделей и эффективно использовать вычислительные ресурсы, TabM успешно конкурирует с классическими моделями градиентного бустинга, такими как CatBoost, XGBoost и LightGBM, которые долгое время считались лучшими для работы с табличными данными.

Архитектура уже доступна для разработчиков и исследователей на GitHub.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *