Исследовательская лаборатория Yandex Research представила инновационную нейросетевую архитектуру под названием TabM, предназначенную для работы с табличными данными.
Эта технология обеспечивает быструю обработку больших объемов информации и позволяет строить высокоточные прогнозы, что делает её востребованной в бизнесе, научных исследованиях и медицине.
Разработка была опробована на платформе Kaggle, известной своими международными соревнованиями по анализу данных и машинному обучению, организованными Google.
В частности, TabM использовалась для прогнозирования выживаемости пациентов после трансплантации костного мозга.
Название TabM расшифровывается как “Tabular DL model that makes Multiple predictions” и представляет собой ансамбль моделей, где каждая модель проводит свой анализ, а итоговый прогноз получается путем усреднения результатов.
В Яндексе отметили, что по итогам тестирования на 46 наборах данных TabM показала лучшие результаты по сравнению с другими решениями, заняв в среднем 1,7 место против 2,9 у ближайшего конкурента.
Кроме того, она продемонстрировала высокую стабильность работы, что особенно важно для практического применения.
Благодаря способности объединять усилия нескольких подмоделей и эффективно использовать вычислительные ресурсы, TabM успешно конкурирует с классическими моделями градиентного бустинга, такими как CatBoost, XGBoost и LightGBM, которые долгое время считались лучшими для работы с табличными данными.
Архитектура уже доступна для разработчиков и исследователей на GitHub.