24 апреля китайский стартап DeepSeek, специализирующийся на разработке искусственного интеллекта, представил предварительную версию своей новой модели обработки больших языковых данных под названием V4. Эта модель позволяет пользователям испытать её обновлённые возможности и функции. Выпуск новой версии состоялся спустя более года после дебюта модели R1, которая произвела впечатление на мировых технологических рынках благодаря своей высокой производительности и экономической эффективности.

Как и предыдущая модель, V4 обладает открытым исходным кодом, что предоставляет разработчикам возможность загружать код, запускать его на локальных машинах и вносить изменения. В компании DeepSeek утверждают, что V4 показывает высокие результаты в сравнении с китайскими конкурентами, особенно в задачах, связанных с агентным программированием, обработкой знаний и выводом заключений.

DeepSeek, основанная в 2023 году, привлекла внимание в конце 2024 года, выпустив бесплатную модель V3 с открытым исходным кодом. По заявлениям компании, эта модель была обучена на менее мощных чипах и стоила значительно дешевле, чем аналогичные разработки от таких компаний, как OpenAI и Google.

В январе 2025 года, спустя несколько недель после выхода V3, компания представила модель R1, которая также продемонстрировала высокие результаты. Китайский стартап сообщил, что на обучение модели R1 было потрачено 294 000 долларов, что значительно ниже затрат, озвученных американскими конкурентами.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *