Новая модель компании, GPT-Realtime-2, представляет собой голосовую систему, разработанную для создания реалистичной вокальной симуляции, способной вести диалог с пользователями. В отличие от своего предшественника (GPT-Realtime-1.5), эта модель оснащена функционалом класса GPT-5, который, по заявлению OpenAI, был создан для обработки более сложных запросов пользователей. Компания также запускает GPT-Realtime-Translate, предназначенную для предоставления услуг перевода в реальном времени, которые "идут в ногу" с пользователем в разговорной манере. Эта функция поддерживает более 70 языков ввода (языков, которые система может понимать) и 13 языков вывода (языков, на которые она переводит).

Кроме того, компания представила новую возможность транскрипции, GPT-Realtime-Whisper, которая предоставляет пользователям возможность преобразования речи в текст в реальном времени, фиксируя взаимодействия по мере их возникновения. "Вместе, модели, которые мы запускаем, переводят аудио в реальном времени от простого обмена репликами к голосовым интерфейсам, которые действительно могут выполнять работу: слушать, рассуждать, переводить, транскрибировать и предпринимать действия по мере развития разговора," заявили в компании.

Кому будут полезны эти обновления? Очевидной целевой аудиторией являются компании, стремящиеся расширить возможности обслуживания клиентов. Однако OpenAI также отмечает, что новые функции помогут в самых разных областях, включая образование, медиа, мероприятия и платформы для создателей контента, среди прочего. Несмотря на то, что эти инструменты кажутся полезными с точки зрения бизнеса, существует вероятность их неправильного использования.

Компания заявила, что разработала защитные механизмы, чтобы предотвратить злоупотребление новыми функциями для создания спама, мошенничества или других форм онлайн-злоупотреблений. В систему встроены определенные триггеры, чтобы "разговоры могли быть остановлены, если они обнаружены как нарушающие наши руководящие принципы по вредоносному контенту," отметили в OpenAI. Все новые голосовые модели включены в Realtime API от OpenAI. Translate и Whisper тарифицируются по минутам, в то время как GPT-Realtime-2 тарифицируется по потреблению токенов.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *