DeepSeek представит V4 с контекстом до миллиона токенов и мультимодальностью

freepik.com
DeepSeek-V4: ИИ с контекстом до 1 млн токенов, обработкой текста, видео и изображений
Компания DeepSeek анонсировала новую ИИ-модель DeepSeek-V4, релиз которой ожидается в апреле 2026 года. Разработка под руководством Лян Вэньфэна велась последние шесть месяцев, с упором на мультимодальный контент и генерацию кода.
Мультимодальность и масштаб
DeepSeek-V4 будет работать с текстом, изображениями и видео, а контекстное окно модели составит до 1 млн токенов. Модель может включать десятки триллионов параметров, что обеспечит высокий уровень обработки сложных задач.
Долгосрочная память и новые архитектуры
Ключевое внимание уделено долгосрочной памяти. Новые архитектурные решения, включая «условную память», помогут эффективно управлять большими объёмами данных и поддерживать производительность при сложных задачах.
Оптимизация для китайской инфраструктуры
DeepSeek-V4 оптимизирована для китайских ИИ-ускорителей и может стать одной из первых моделей, полностью работающих на национальной вычислительной инфраструктуре. Это ускорит обработку мультимодальных данных внутри страны.
Интерес к рынку и конкуренция
Интерес к V4 усилился после появления Healer Alpha и Hunter Alpha на платформе OpenRouter. В апреле также ожидается релиз модели Tencent с 30 млрд параметров, что делает китайский рынок ИИ особенно насыщенным, сообщает the-geek.ru.
Больше новостей и эксклюзивных видео смотрите в канале Самара Онлайн 24 в MAX.

