Учёные из Китая представили фотонную нейросеть, в которой вычисления происходят буквально «на лету» — за счёт дифракции света и оптических взаимодействий. Разработанная исследователями из Северо-Западного политехнического университета и Университета Юго-Восточного Китая архитектура основана на концепции Extreme Learning Machine (ELM) — типе нейросетей с фиксированным скрытым слоем, где обучение происходит исключительно на выходных весах.

Однако ключевое отличие — это реализация скрытого слоя не через программную симуляцию, а с помощью физических оптических процессов.

Каждый нейрон в сети получает сигналы через несколько световых путей одновременно — это и называется фотонными мультисинапсами.

Такая конфигурация даёт не только высокую точность распознавания, но и существенно ускоряет работу.

Система достигла 99,79% точности на наборе данных MNIST (распознавание рукописных цифр), 98,26% на Fashion-MNIST (изображения одежды) и 90,29% на сложном датасете CIFAR-10 (цветные фотографии объектов).

Это выше, чем у большинства архитектур.

Иллюстрация: Sora Один из главных факторов успеха — использование «мультисинаптической» оптики.

Вместо одиночного соединения между нейронами здесь используется множество параллельных путей, которые формируются за счёт дублирования входного изображения и направляются по разным траекториям.

Такой подход повышает устойчивость к шуму, обеспечивает точную передачу информации и улучшает обучение без необходимости численного моделирования.

Благодаря физической реализации вычислений, обучение модели занимает всего несколько секунд.

Энергопотребление измеряется на уровне аттоджоулей на одну операцию умножения-сложения — это на порядки ниже по сравнению с современными цифровыми чипами.

Производительность достигает 2,89 TOPS/s, что делает архитектуру перспективной для энергоэффективных ИИ-устройств.

Источник: Zhuonan Jia, Haopeng Tao, Guang-Bin Huang, Ting Mei Кроме того, фотонная сеть не требует сложного программного обучения — вся её структура формируется за счёт дифракции света, а обучение происходит только на уровне цифровой обработки выходных данных.

Это резко снижает требования к оборудованию и позволяет создавать компактные устройства на базе оптики.

Работа открывает путь к новым поколениям «аналоговых» нейросетей, в которых вычисления происходят со скоростью света — в буквальном смысле.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *