Ученые призывают не считать «размышления» ИИ настоящим мышлением: цепочки рассуждений могут быть лишь статистическим инструментом

Группа исследователей под руководством Суббарао Камбхампати из Университета штата Аризона опубликовала работу, в которой подвергается сомнению распространённое предположение о том, что промежуточные цепочки рассуждений больших языковых моделей отражают их реальный процесс мышления. На фоне активного развития больших рассуждающих моделей (Large Reasoning Models, LRM) авторы утверждают, что модели вроде OpenAI o1 и DeepSeek R1 создают лишь убедительную иллюзию когнитивного процесса, генерируя длинные последовательности токенов — Chain of Thought (CoT).

С точки зрения архитектуры трансформеров, такие цепочки не являются механизмом логического вывода. Они представляют собой результат статистического прогнозирования очередного токена на основе предыдущего контекста. Исследователи обращают внимание на феномен «Aha-момента» — фраз вроде «Ага, теперь я понял», — который не сопровождается качественным изменением внутренних вычислений нейросети. По мнению учёных, подобные конструкции — лишь культурная имитация человеческого стиля мышления, усвоенная моделью при обучении на массивах текстов.

В техническом плане работа рассматривает модели через призму обучения с подкреплением на основе проверяемых вознаграждений (Reinforcement Learning with Verifiable Rewards, RLVR). При таком подходе система оптимизируется исключительно ради правильного конечного ответа, а промежуточные токены не имеют самостоятельной семантической нагрузки и не проходят отдельную проверку. Исследователи предлагают считать их формой адаптивного расширения контекста — механизмом, преобразующим исходную задачу в последовательность токенов, где статистическая вероятность верного ответа повышается.

Для проверки гипотезы использовались задачи с формальной верификацией, включая навигацию в лабиринтах и поиск кратчайших путей алгоритмами семейства A*. Результаты показали, что модели сохраняли высокую точность не только при корректных рассуждениях, но и когда цепочки объяснений полностью заменялись на ошибочные или переставленные. Падение производительности наблюдалось лишь при случайном смешивании различных шаблонов рассуждений. Этот эффект авторы назвали U-образной зависимостью: система ориентируется не на внутреннюю логику объяснений, а на статистическую структуру текста, используя его как дополнительный шаблон для генерации ответа.

Дополнительным аргументом стали эксперименты с так называемыми no-maze-экземплярами — искусственно упрощёнными лабиринтами, где между стартом и целью нет препятствий. Несмотря на тривиальность задачи, модели часто генерировали многостраничные цепочки. Это, по мнению авторов, опровергает гипотезу о том, что длина рассуждений отражает объём вычислительных усилий: скорее, она является артефактом обучающей выборки, в которой сложные задачи статистически коррелировали с длинными объяснениями.

Учёные критикуют и концепцию интерпретируемости современных LLM через анализ промежуточных токенов, предупреждая об опасном эффекте ложного доверия. Пользователь может воспринять правдоподобный текст как доказательство корректности работы системы, что несёт особые риски в медицине, инженерии и праве, где человек физически не способен оперативно проверить десятки страниц автоматических рассуждений. Индустрия, по их мнению, оказалась в ловушке «театра рассуждений», расходуя ресурсы на создание всё более человекоподобных объяснений вместо разработки архитектур с формально проверяемым логическим выводом. В качестве альтернативы предлагаются подходы класса LLM-Modulo, где языковые модели выступают генераторами гипотез, а проверка корректности возлагается на внешние математически строгие алгоритмы и системы верификации.

Главный вывод работы: современные цепочки рассуждений не следует рассматривать как окно во внутренний мир искусственного интеллекта. Авторы призывают отказаться от антропоморфизации промежуточных токенов и перейти к парадигме оценки ИИ, где качество системы определяется не убедительностью «внутреннего монолога», а способностью выдавать результаты, корректность которых может быть независимо подтверждена.

Источник

Купить ключ Windows 10 pro — активация 100%

Ключ Windows 11 Pro / 10 Pro — гарантия активации

Windows 10 Home (Домашняя) — ключ активации

Windows 10 / 11 Home OEM — ключ активации

Ключ активации Windows 10 Pro / Windows 11 Pro

Ключ Windows 11 Home — гарантия активации

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Рекомендуем

MS Office 2019 Дом и Учеба — привязка к MS-аккаунту

Microsoft Office 2016 Pro Plus, Привязка к MS аккаунту

F-Secure Safe 2 года / 15 устройств (подписка) Global

Комплект Windows 10 Pro и Office 2019 Pro Plus — онлайн активация

Microsoft Office 2016 Standard — Он-лайн активация

CorelDRAW Graphics Suite 2024 для Mac / 2 PC

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Добавить комментарий Отменить ответ

Контакты

info@el-shop-keys.ru

Информация для пользователей

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Рекомендуем

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Ученые призывают не считать «размышления» ИИ настоящим мышлением: цепочки рассуждений могут быть лишь статистическим инструментом

Добавить комментарий Отменить ответ

Мы используем файлы cookie и обрабатываем персональные данные