30 ноября 2025
Китайський стартап DeepSeek представив нову ШІ-модель DeepseekMath-V2, яка демонструє вражаючі результати при розв'язанні складних математичних задач. Алгоритм впорався з багатьма завданнями Міжнародної математичної олімпіади (IMO 2025) та Китайської математичної олімпіади (CMO 2024), показавши при цьому результат на рівні золотої медалі.
Джерело зображень: the-decoder.com
У повідомленні зазначено, що DeepseekMath-V2 набрала 118 з 120 балів у задачах Putnam, що суттєво вище найкращого результату людини в 90 балів. DeepSeek підкреслює, що раніше ШІ-моделі часто давали правильні відповіді на складні математичні задачі, але при цьому не демонстрували правильного ходу розв'язання. Для виправлення ситуації ШІ-модель використовує багатоетапний процес з окремим верифікатором для оцінки коректності кроків розв'язання задачі та необхідності їх переперевірки. Така структура дозволяє алгоритму перевіряти та вдосконалювати свої рішення в режимі реального часу.

З технічної точки зору DeepseekMath-V2 побудована на основі базової моделі Deepseek-V3.2-Exp-Base. У описі DeepSeek жодного разу не згадується використання зовнішніх інструментів, таких як калькулятори чи інтерпретатори коду. У ключових експериментах одна й та ж модель DeepseekMath-V2 використовується як для генерації доказів, так і для їх перевірки. Висока продуктивність алгоритму обумовлена здатністю критикувати та покращувати власні висновки замість того, щоб залучати зовнішнє програмне забезпечення. Для розв'язання більш складних задач модель нарощує обчислювальні потужності на етапі тестування, паралельно створюючи та перевіряючи безліч можливих доказів, щоб підвищити рівень впевненості в правильності кінцевої відповіді.

Реліз DeepSeek відбувся після анонсу ще не випущених ШІ-моделей OpenAI та Google Deepmind, які досягли схожих результатів у розв'язанні складних математичних задач. Примітно, що ці алгоритми досягли такого результату завдяки здатності до міркування, а не цільовій оптимізації для математичних олімпіад. Якщо насправді успіхи цих алгоритмів виявляться такими вражаючими, це означатиме, що мовні моделі наблизилися до моменту, коли вони зможуть розв'язувати складні, абстрактні задачі, що традиційно вважалося виключно людським умінням.
Зазначимо, що рішення DeepSeek розкрити технічні деталі моделі DeepseekMath-V2 різко контрастує з секретністю, яку дотримуються Google та OpenAI. Американські компанії тримають у таємниці деталі архітектури власних ШІ-моделей, тоді як китайський стартап буквально розкриває всі карти, наочно демонструючи, що компанія йде в ногу з провідними представниками галузі.
Хочеш дізнатися більше — читай відгуки
← Вернуться на предыдущую страницу
Померла зірка серіалу "Альф" Енн Шедін, яка зіграла Кейт: яким було її життя 15 июня 2026
Померла зірка серіалу "Альф", яка зіграла Кейт: яким було її життя Енн Шедін після феноменального успіху та зникнення з екранів Актриса майже повністю зникла з екранів пілся виходу культового серіалу
Веб-версія Google Earth отримала загальнодоступний авіасимулятор 15 июня 2026
Ідея вбудувати в картографічний сервіс Earth симулятор авіапольотів відвідала Google ще в 2007 році, коли він з'явився в якості прихованої функції («пасхального яйця») настільної версії додатку. Понадобилося ще майже двадцять років, щоб аналогічну функцію реалізувати у веб-версії сервісу, зробивши її використання безкоштовним і відкритим.
Перший складний iPhone буде коротким у складеному стані, а в розкладеному нагадуватиме iPad mini 15 июня 2026
Зусиллями ресурсів Bloomberg та 9to5Mac на минулому тижні сформувався «портрет» першого складного смартфона Apple, який, якщо вірити чуткам, носитиме ім'я «iPhone Ultra». Своєю компоновкою пристрій відрізнятиметься не лише від усіх iPhone, але й від більшості інших складних смартфонів. За інтерфейсом у розкладеному стані iPhone Ultra повторюватиме iPad.