DeepSeek представит V4 с контекстом до миллиона токенов и мультимодальностью

По данным источников, DeepSeek готовит релиз V4...

freepik.com

DeepSeek-V4: ИИ с контекстом до 1 млн токенов, обработкой текста, видео и изображений

Компания DeepSeek анонсировала новую ИИ-модель DeepSeek-V4, релиз которой ожидается в апреле 2026 года. Разработка под руководством Лян Вэньфэна велась последние шесть месяцев, с упором на мультимодальный контент и генерацию кода.

Мультимодальность и масштаб

DeepSeek-V4 будет работать с текстом, изображениями и видео, а контекстное окно модели составит до 1 млн токенов. Модель может включать десятки триллионов параметров, что обеспечит высокий уровень обработки сложных задач.

Долгосрочная память и новые архитектуры

Ключевое внимание уделено долгосрочной памяти. Новые архитектурные решения, включая «условную память», помогут эффективно управлять большими объёмами данных и поддерживать производительность при сложных задачах.

Оптимизация для китайской инфраструктуры

DeepSeek-V4 оптимизирована для китайских ИИ-ускорителей и может стать одной из первых моделей, полностью работающих на национальной вычислительной инфраструктуре. Это ускорит обработку мультимодальных данных внутри страны.

Интерес к рынку и конкуренция

Интерес к V4 усилился после появления Healer Alpha и Hunter Alpha на платформе OpenRouter. В апреле также ожидается релиз модели Tencent с 30 млрд параметров, что делает китайский рынок ИИ особенно насыщенным, сообщает the-geek.ru.

Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.