Компания Positive Technologies, специализирующаяся на кибербезопасности, разработала нейросеть под названием ByteDog, которая способна идентифицировать вредоносный код, анализируя файлы напрямую, без предварительной обработки. Эта модель, построенная на базе архитектуры трансформера, обучена определять вредоносный код на уровне байтов, что позволяет ей обнаруживать угрозы на 20% точнее по сравнению с традиционными системами машинного обучения. Разработчики подчеркнули, что ByteDog самостоятельно выявляет закономерности и экстраполирует их, превосходя системы, работающие на основе фиксированных правил.
Андрей Кузнецов, директор по машинному обучению в Positive Technologies, отметил, что обучение ByteDog проводилось на реальных примерах киберинцидентов в течение года. В результате модель продемонстрировала значительное преимущество перед классическими моделями машинного обучения как в плане качества, так и скорости обнаружения угроз.
Нейросеть ByteDog интегрируется в продукты и сервисы компании для выявления киберугроз. Она позволяет проводить анализ файлов на устройствах пользователей без необходимости их распаковки и извлечения исходного кода, что ускоряет процесс обнаружения вирусов и повышает уровень защиты.
Основной технической сложностью при разработке было управление большими объемами данных, так как обычный файл может содержать миллионы байт, каждый из которых имеет значение. ByteDog решает эту задачу, анализируя файлы по частям и собирая целостную картину. Модель способна функционировать на устройствах пользователей без использования графического ускорителя.