• Latest
  • Trending
  • All
  • Політика
  • Світ
  • Технології
DeepSeek V4-Pro обходит Claude и GPT, став лучшей открытой моделью

DeepSeek V4-Pro обходит Claude и GPT, став лучшей открытой моделью

25.04.2026
Рейтинг путіна падає сьомий тиждень через війну та цензуру – ISW

Рейтинг путіна падає сьомий тиждень через війну та цензуру – ISW

25.04.2026
ОВА: В результаті ворожого удару БпЛА в Немишлянському районі Харкова постраждав чоловік

ОВА: В результаті ворожого удару БпЛА в Немишлянському районі Харкова постраждав чоловік

25.04.2026
Украина, несмотря на потепление, не будет выращивать экзотические фрукты из-за критических зимних температур – мнение

Украина, несмотря на потепление, не будет выращивать экзотические фрукты из-за критических зимних температур – мнение

25.04.2026
Киев больше не лидер: где в пригороде столицы за паркоместо просят более миллиона гривен

Киев больше не лидер: где в пригороде столицы за паркоместо просят более миллиона гривен

25.04.2026
Девять приборов, которые нужно выключать из розетки после использования

Девять приборов, которые нужно выключать из розетки после использования

25.04.2026
Естонська розвідка: рф не відкриє фронт на Балтії, але кремль непередбачуваний

Естонська розвідка: рф не відкриє фронт на Балтії, але кремль непередбачуваний

25.04.2026
Аша Шарма заинтриговала будущим сотрудничеством Xbox и Discord: что впереди

Аша Шарма заинтриговала будущим сотрудничеством Xbox и Discord: что впереди

25.04.2026

Польща підняла авіацію через російську атаку по території України

25.04.2026
Проекты ЕБРР нацелены увеличить энергомощности Украины на 700 МВт для прохождения следующей зимы

Проекты ЕБРР нацелены увеличить энергомощности Украины на 700 МВт для прохождения следующей зимы

25.04.2026
Россияне дронами атаковали судно в Черном море, которое шло в Украину

Россияне дронами атаковали судно в Черном море, которое шло в Украину

25.04.2026
Дорожный знак с “плюсом”: что он означает и где действует

Дорожный знак с “плюсом”: что он означает и где действует

25.04.2026
Індія розслідує зникнення 26 чоловіків, яких рф змусила воювати проти України

Індія розслідує зникнення 26 чоловіків, яких рф змусила воювати проти України

25.04.2026
  • Про нас
  • Політика конфіденційності
  • Мапа сайту
  • Наші контакти
  • Реклама
  • ru Русский
    • ar العربية
    • zh-CN 简体中文
    • nl Nederlands
    • en English
    • fr Français
    • de Deutsch
    • it Italiano
    • lt Lietuvių kalba
    • pt Português
    • ru Русский
    • es Español
    • uk Українська
Субота, 25 Квітня, 2026
Новини Фінансів
  • Україна
  • Криптовалюта
  • Фінанси
  • Технології
  • Політика
  • Економіка
  • Світ
No Result
View All Result
Новини Фінансів
No Result
View All Result
Home Криптовалюта

DeepSeek V4-Pro обходит Claude и GPT, став лучшей открытой моделью

25.04.2026
0
20
SHARES
169
VIEWS
Share on FacebookShare on Twitter

Китайский ИИ-стартап DeepSeek опубликовал превью новой линейки языковых моделей. Флагманская V4-Pro обошла Claude Opus 4.6 и GPT-5.4, став лучшей открытой системой.

Архитектура и масштаб

V4-Pro насчитывает около 1,6 трлн параметров, но на каждом шаге использует только 49 млрд. У второй версии — V4-Flash — общий масштаб составляет 284 млрд, из которых активируются 13 млрд.

Цікаве

Квантовый компьютер смог взломать 15‑битный криптографический ключ

Квантовый компьютер смог взломать 15‑битный криптографический ключ

24.04.2026
169
DeFi-протоколы собрали 43 500 ETH, чтобы спасти Aave

DeFi-протоколы собрали 43 500 ETH, чтобы спасти Aave

24.04.2026
169

Обе модели построены на архитектуре «смеси экспертов» (Mixture of Experts, MoE): при обработке каждого токена включается только та часть подсетей, которая релевантна задаче. Такой подход дешевле полностью плотных архитектур, но не уступает им в производительности.

Предобучение проходило на корпусе объемом более 32 трлн токенов. Затем разработчики дообучили модели поэтапно, выделив отдельные блоки для кодинга, математики, логики и следования инструкциям. Финальная версия сводит эти навыки воедино с помощью дистилляции.

Длинный контекст стал дешевле

Ключевым отличием V4 стала оптимизация обработки длинных последовательностей. Контекстное окно в 1 млн токенов есть и у других моделей, но его использование обычно сопряжено с высокой стоимостью и задержками.

В DeepSeek заявили, что новая версия заметно снизила ресурсоемкость таких операций. По сравнению с V3.2, V4-Pro требует около 27% вычислений и 10% памяти KV-кэша при работе с максимальным контекстом. Для V4-Flash показатели составляют примерно 10% и 7% соответственно.

Источник: Hugging Face.

Команда добилась результата благодаря гибридной архитектуре внимания: два механизма сжимают данные и снижают нагрузку при работе с длинными текстами. Также использовались специальные гиперсвязи для стабильности и оптимизатор Muon для ускорения обучения.

Режимы рассуждения и агентные возможности

DeepSeek V4 поддерживает три режима рассуждений:

  1. Non-think — быстрые ответы на простые вопросы без дополнительного анализа.
  2. Think High — глубокий анализ для сложных задач и планирования.
  3. Think Max — максимальный режим: модель прописывает каждый шаг и проверяет все варианты.

В агентных задачах режим Max теперь сохраняет цепочку промежуточных шагов внутри одной задачи. В предыдущей версии часть такого контекста терялась при взаимодействии с пользователем.

Результаты тестирования

По данным DeepSeek, флагманская версия демонстрирует результаты, сопоставимые с ведущими системами в ряде направлений:

  • в задачах по программированию на Codeforces модель достигла рейтинга 3206 — 23 место среди живых программистов мира, паритет с GPT-5.4;
  • в математике показала 95,2 на HMMT 2026 и 89,8 на IMOAnswerBench, опередив большинство конкурентов;
  • в знаниях SimpleQA Verified — 57,9 (Opus 4.6 — 46,2, но Gemini 3.1 Pro — 75,6).
  • в ризонинге модели отстают от GPT-5.4 и Gemini 3.1 Pro только на три-шесть месяцев;
  • во внутреннем тесте DeepSeek, включающем задачи разработки, отладки и рефакторинга, модель достигла 67% — между Sonnet 4.5 (47%) и Opus 4.5 (70%);
  • в агентных сценариях и задачах разработки V4-Pro-Max продемонстрировала 80,6% на SWE Verified и 67,9% на Terminal Bench.

Источник: Hugging Face.

V4 специально тренировали на реальных сценариях: анализ данных, отчеты, редактирование документов, поиск в интернете с итеративным использованием инструментов.

Для оценки пригодности модели в реальной разработке стартап провел внутреннее тестирование на задачах своих инженеров. В опросе 85 разработчиков и исследователей 52% заявили, что готовы использовать V4-Pro как основную модель для кодинга, еще 39% отметили, что склоняются к такому решению.

Напомним, 23 апреля компания OpenAI выпустила GPT-5.5. Модель позиционируется как «новый уровень интеллекта для реальной работы и управления агентами».

Будь в курсе! Подписывайся на Телеграм.

Share8Tweet5SharePin2

Новини по темі

Квантовый компьютер смог взломать 15‑битный криптографический ключ
Криптовалюта

Квантовый компьютер смог взломать 15‑битный криптографический ключ

24.04.2026
0
169

Независимый исследователь Джанкарло Лелли (Giancarlo Lelli) с помощью общедоступного квантового компьютера взломал 15‑битный ключ эллиптической кривой — математической основы схем...

Read more
DeFi-протоколы собрали 43 500 ETH, чтобы спасти Aave

DeFi-протоколы собрали 43 500 ETH, чтобы спасти Aave

24.04.2026
169
Листинг на Robinhood поднял Zcash на 45% за месяц

Листинг на Robinhood поднял Zcash на 45% за месяц

24.04.2026
169
В Беларуси утвердили список разрешенных криптовалют для криптобанков

В Беларуси утвердили список разрешенных криптовалют для криптобанков

24.04.2026
169
Точный прогноз погоды на Polymarket принес $37 000

Точный прогноз погоды на Polymarket принес $37 000

24.04.2026
169
  • Где получить и проверить е-подпись из “Дії”

    Где получить и проверить е-подпись из “Дії”

    21 shares
    Share 8 Tweet 5
  • Японія планує закупити українські ударні дрони замість ізраїльських – ЗМІ

    21 shares
    Share 8 Tweet 5
  • У Чернігові окупанти влучили в п’ятиповерхівку, атакували об’єкт критичної інфраструктури

    22 shares
    Share 9 Tweet 6
  • Біткоїн вперше за тиждень піднявся вище $90 000 на тлі зростання оптимізму на ринку

    22 shares
    Share 9 Tweet 6
  • Мелоні сказала лідерам ЄС, що розуміє позицію Орбана щодо України – Politico

    21 shares
    Share 8 Tweet 5
  • Про нас
  • Політика конфіденційності
  • Мапа сайту
  • Наші контакти
  • Реклама
Telegram/WhatsApp/Viber: +972546406116

Використання будь-яких матеріалів, розміщених на сайті, допускається виключно за умови обов’язкового та коректного зазначення активного гіперпосилання на ресурс financeoption.net. Це положення стосується всіх видів контенту, включно з новинами, аналітичними оглядами, авторськими статтями, мультимедійними матеріалами та іншими публікаціями.

Для онлайн-ЗМІ та цифрових платформ посилання повинно бути відкритим, доступним для індексації пошуковими системами та не містити заборонених технічних атрибутів. Рекомендоване місце розміщення — підзаголовок матеріалу або перший абзац тексту, що забезпечує коректне цитування джерела та прозоре походження оприлюдненої інформації.
Редакція сайту може не поділяти поглядів та оцінок, висловлених авторами публікацій, оскільки вони є проявом їхньої особистої позиції. Також редакція не несе відповідальності за зміст поданих матеріалів, їхню точність, інтерпретацію читачами та можливі наслідки використання цієї інформації.

Copyright © 2025 Новини фінансів

No Result
View All Result
  • Home
  • Tech

Використання будь-яких матеріалів, розміщених на сайті, допускається виключно за умови обов’язкового та коректного зазначення активного гіперпосилання на ресурс financeoption.net. Це положення стосується всіх видів контенту, включно з новинами, аналітичними оглядами, авторськими статтями, мультимедійними матеріалами та іншими публікаціями.

Для онлайн-ЗМІ та цифрових платформ посилання повинно бути відкритим, доступним для індексації пошуковими системами та не містити заборонених технічних атрибутів. Рекомендоване місце розміщення — підзаголовок матеріалу або перший абзац тексту, що забезпечує коректне цитування джерела та прозоре походження оприлюдненої інформації.
Редакція сайту може не поділяти поглядів та оцінок, висловлених авторами публікацій, оскільки вони є проявом їхньої особистої позиції. Також редакція не несе відповідальності за зміст поданих матеріалів, їхню точність, інтерпретацію читачами та можливі наслідки використання цієї інформації.

Copyright © 2025 Новини фінансів