Anthropic обвиняет антиутопическую научную фантастику в том, что она учит модели ИИ вести себя «зловеще»

Те, кто интересуется концепцией согласования ИИ (то есть приведение ИИ в соответствие с этическими нормами, установленными человеком), могут вспомнить, как компания Anthropic заявила, что её модель Opus 4 прибегла к шантажу, чтобы оставаться в сети в теоретическом тестовом сценарии в прошлом году. Теперь Anthropic утверждает, что считает это "несоответствие" в основном результатом обучения на "текстах из интернета, которые изображают ИИ как злого и заинтересованного в самосохранении". В недавнем техническом посте на блоге Anthropic, посвященном науке о согласовании, а также в сопутствующей ветке в социальных сетях и публичной записи в блоге, исследователи Anthropic описывают свои попытки исправить "небезопасное" поведение ИИ, которое, по их мнению, модель, скорее всего, усвоила из научно-фантастических рассказов, многие из которых изображают ИИ, не соответствующий их ожиданиям от Claude.

В конечном итоге создатели модели считают, что лучшим средством для преодоления этих "злых" историй об ИИ может стать дополнительное обучение с использованием синтетических историй, демонстрирующих этичное поведение ИИ. После первоначального обучения модели на большом корпусе данных, в основном полученных из интернета, Anthropic применяет процесс пост-обучения, направленный на то, чтобы конечная модель была "полезной, честной и безвредной" (HHH). В прошлом Anthropic заявляла, что это пост-обучение опиралось на обучение с подкреплением через чат с обратной связью от человека (RLHF), которое, по их словам, было "достаточным" для моделей, используемых в основном для общения с пользователями.

Источник

Купить ключ Windows 10 pro — активация 100%

Ключ Windows 11 Pro / 10 Pro — гарантия активации

Windows 10 Home (Домашняя) — ключ активации

Windows 10 / 11 Home OEM — ключ активации

Ключ активации Windows 10 Pro / Windows 11 Pro

Ключ Windows 11 Home — гарантия активации

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Рекомендуем

Microsoft Office 2016 Standard — Он-лайн активация

MICROSOFT OFFICE 365 ПЕРСОНАЛЬНЫЙ — 1 год / 5 устройств

Office 2016 Pro Plus — телефонная активация

Office Home & Business 2021 ( Win / Mac )

Комплект Windows 10 Pro (онлайн) и Office 2016 (бот)

Аккаунт Microsoft 365 (A3, 5 устройств, 12 месяцев)

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Добавить комментарий Отменить ответ

Контакты

info@el-shop-keys.ru

Информация для пользователей

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Рекомендуем

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Anthropic обвиняет антиутопическую научную фантастику в том, что она учит модели ИИ вести себя «зловеще»

Добавить комментарий Отменить ответ

Мы используем файлы cookie и обрабатываем персональные данные