OpenAI запускает новые функции голосового интеллекта в своем API

Новая модель компании, GPT-Realtime-2, представляет собой голосовую систему, разработанную для создания реалистичной вокальной симуляции, способной вести диалог с пользователями. В отличие от своего предшественника (GPT-Realtime-1.5), эта модель оснащена функционалом класса GPT-5, который, по заявлению OpenAI, был создан для обработки более сложных запросов пользователей. Компания также запускает GPT-Realtime-Translate, предназначенную для предоставления услуг перевода в реальном времени, которые "идут в ногу" с пользователем в разговорной манере. Эта функция поддерживает более 70 языков ввода (языков, которые система может понимать) и 13 языков вывода (языков, на которые она переводит).

Кроме того, компания представила новую возможность транскрипции, GPT-Realtime-Whisper, которая предоставляет пользователям возможность преобразования речи в текст в реальном времени, фиксируя взаимодействия по мере их возникновения. "Вместе, модели, которые мы запускаем, переводят аудио в реальном времени от простого обмена репликами к голосовым интерфейсам, которые действительно могут выполнять работу: слушать, рассуждать, переводить, транскрибировать и предпринимать действия по мере развития разговора," заявили в компании.

Кому будут полезны эти обновления? Очевидной целевой аудиторией являются компании, стремящиеся расширить возможности обслуживания клиентов. Однако OpenAI также отмечает, что новые функции помогут в самых разных областях, включая образование, медиа, мероприятия и платформы для создателей контента, среди прочего. Несмотря на то, что эти инструменты кажутся полезными с точки зрения бизнеса, существует вероятность их неправильного использования.

Компания заявила, что разработала защитные механизмы, чтобы предотвратить злоупотребление новыми функциями для создания спама, мошенничества или других форм онлайн-злоупотреблений. В систему встроены определенные триггеры, чтобы "разговоры могли быть остановлены, если они обнаружены как нарушающие наши руководящие принципы по вредоносному контенту," отметили в OpenAI. Все новые голосовые модели включены в Realtime API от OpenAI. Translate и Whisper тарифицируются по минутам, в то время как GPT-Realtime-2 тарифицируется по потреблению токенов.

Источник

Купить ключ Windows 10 pro — активация 100%

Ключ Windows 11 Pro / 10 Pro — гарантия активации

Windows 10 Home (Домашняя) — ключ активации

Windows 10 / 11 Home OEM — ключ активации

Ключ активации Windows 10 Pro / Windows 11 Pro

Ключ Windows 11 Home — гарантия активации

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Рекомендуем

Office 2016 Pro Plus — телефонная активация

Комплект Windows 11 Pro и Office 2021 Pro Plus — телефонная активация

Комплект Windows 11 Pro и Office 2019 Pro plus (телефонная)

Microsoft Office 2016 Pro Plus — онлайн активация

Office 2021 Pro Plus LTSC (корпоративная версия)

CorelDRAW Standard 2020 / Бессрочная лицензия

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Добавить комментарий Отменить ответ

Контакты

info@el-shop-keys.ru

Информация для пользователей

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

Рекомендуем

БЫСТРАЯ ДОСТАВКА

ПРОСТАЯ ЗАМЕНА

ПОДДЕРЖКА 24/7

БЕЗОПАСНЫЕ ПЛАТЕЖИ

OpenAI запускает новые функции голосового интеллекта в своем API

Добавить комментарий Отменить ответ

Мы используем файлы cookie и обрабатываем персональные данные