18 месяцев, переписавших ИИ: Полная хронология с января 2025 по май 2026 года

Январь 2025: Шок от DeepSeek

20 января 2025 года китайская лаборатория ИИ под названием DeepSeek выпустила модель рассуждений с открытыми весами — R1. За семь дней она возглавила чарты Apple App Store как в США, так и в Китае и набрала более 100 миллионов пользователей.

Цифры, которые потрясли отрасль: DeepSeek заявила, что обучение R1 обошлось примерно в 6 миллионов долларов — цифра, которая не была независимо подтверждена. Широко сообщалось, что обучение GPT-4 от OpenAI обошлось где-то в диапазоне от десятков до сотен миллионов долларов. Если разрыв в эффективности хотя бы приблизительно точен, это говорит о том, что предположение о том, что передовой ИИ требует массивных инвестиций в вычисления, возможно, было преувеличено. Если заявление об эффективности выдержит проверку, оно предполагает, что допущение о необходимости десятков миллиардов долларов в вычислительных инвестициях для передового ИИ могло быть неверным.

Рынки отреагировали немедленно. Акции Nvidia упали на 18% за один день — потеря, широко сообщаемая примерно в 593 миллиарда долларов рыночной капитализации — одно из крупнейших однодневных падений рыночной капитализации в истории фондового рынка США.

Техническое значение: DeepSeek R1 использовал технику под названием Mixture of Experts (MoE) более агрессивно, чем западные лаборатории, активируя лишь часть своих параметров на каждый запрос. В сочетании с инновациями в эффективности обучающих данных и обучением с подкреплением удалось достичь производительности, сопоставимой с o1 от OpenAI, при значительно меньших затратах. Последствия для допущения «кто контролирует вычисления, контролирует ИИ» ещё анализируются.

Фондовые рынки резко отреагировали на выпуск DeepSeek — Nvidia потеряла ~593 млрд долларов за один день

Февраль 2025: Расширенное мышление Anthropic

24 февраля 2025 года Anthropic выпустила Claude 3.7 Sonnet с новой возможностью под названием Extended Thinking (Расширенное мышление) — видимый режим цепочки рассуждений, позволяющий модели обдумывать проблемы перед генерацией ответа. Пользователи могут наблюдать за процессом мышления в режиме реального времени.

На GPQA Diamond — бенчмарке, составленном из вопросов, разработанных учёными с учёными степенями в области физики, химии и биологии, где специалисты-люди в среднем набирают около 65% — Claude 3.7 Sonnet набрал 84,8%. Это поставило его впереди всех других публично доступных моделей на момент выпуска.

Одновременно Anthropic запустила Claude Code — агентский инструмент программирования, разработанный для асинхронного выполнения сложных, многоэтапных задач кодирования. Это ознаменовало первый серьёзный выход Anthropic в пространство продуктов «ИИ-агентов», которое доминировало бы в остальной части года.

Март 2025: Gemini 2.5 Pro выходит в лидеры

Google выпустил Gemini 2.5 Pro Experimental в марте 2025 года. В течение нескольких дней после выпуска он занял первое место на LMSYS Chatbot Arena — крупнейшей публичной платформе оценки ИИ в режиме прямого противостояния — опередив GPT-4.5 примерно на 40 очков Elo. Этот разрыв считается существенным в таблице лидеров, где разницы в 10–15 очков обычно сигнализируют о значительных разрывах в возможностях.

Gemini 2.5 Pro представил режим рассуждений "Deep Think" и контекстное окно в 1 миллион токенов. На Poe, агрегаторной платформе ИИ, он захватил примерно 30% всего объёма запросов на рассуждения в течение шести недель после запуска.

Март также стал поворотным моментом для интероперабельности ИИ. Model Context Protocol (MCP) от Anthropic — открытый стандарт для подключения моделей ИИ к внешним инструментам — получил широкое распространение, когда ChatGPT от OpenAI объявил о поддержке протокола. Google подтвердил поддержку в апреле. MCP теперь фактически является отраслевым стандартом для интеграции инструментов ИИ.

Апрель–Май 2025: Meta и OpenAI расширяют поле

Meta выпустила Llama 4 в апреле 2025 года с двумя вариантами: Scout (для эффективности) и Maverick (для рассуждений). Оба были моделями с открытыми весами, что означало возможность публичного скачивания параметров. Llama 4 Maverick конкурировала с GPT-4.5 по нескольким бенчмаркам и представляла собой наиболее мощную из выпущенных на тот момент моделей с открытыми весами.

OpenAI последовала в апреле с o3 и o4-mini — следующим поколением своей серии моделей рассуждений — вместе с GPT-4.1, обновлением, ориентированным на следование инструкциям и снижение задержки. Темп выпусков ускорялся настолько, что отрасль в значительной мере перестала воспринимать отдельные запуски моделей как знаковые события и начала рассматривать их как плановые обновления.

В мае 2025 года Anthropic выпустила Claude 4, включая Opus 4.5 и Sonnet 4.5. Вариант Opus был позиционирован как модель для анализа документов и корпоративных исследований. Он значительно превзошёл своего предшественника в задачах с длинным контекстом и многоэтапных рассуждениях.

Высшая математика — ИИ достиг уровня золотой медали на Международной математической олимпиаде в июле 2025 года

Июль 2025: ИИ побеждает на МОМ

В июле 2025 года как модель рассуждений OpenAI, так и Gemini Deep Think от Google DeepMind достигли результатов, эквивалентных золотой медали на Международной математической олимпиаде — независимо друг от друга, в одном соревновательном цикле. Gemini Deep Think показал результат, эквивалентный золотой медали, решив все задачи на естественном языке в рамках стандартного ограничения по времени. Google DeepMind сообщил о результате в 35 очков из возможных 42.

Для контекста: МОМ — самый престижный математический конкурс для школьников в мире. Золотые медалисты среди людей — одни из самых математически одарённых людей на планете. Тот факт, что две отдельные системы ИИ достигли этого стандарта в один год, используя принципиально разные архитектуры, предполагает, что это был не случайный результат.

В том же месяце обе системы также заняли первые места на Международной олимпиаде по программированию среди студентов (ICPC). Эти результаты ознаменовали момент, когда ИИ пересёк порог от «конкурентоспособного с сильными математиками-людьми» до «конкурентоспособного с лучшими из лучших».

Август 2025: GPT-5 и Закон ЕС об ИИ

OpenAI выпустила GPT-5 7 августа 2025 года. Модель представила динамические «режимы мышления» — позволяя пользователям выбирать между быстрыми ответами и расширенными рассуждениями — и OpenAI сообщила о значительно сниженном уровне галлюцинаций по сравнению с GPT-4. Она обрабатывала текст, изображения и структурированные данные нативно.

Тот же месяц имел регуляторное значение: 2 августа 2025 года стало датой, когда положения, регулирующие модели ИИ общего назначения (GPAI) в соответствии с Законом ЕС об ИИ, официально вступили в силу. Это первый в мире комплексный закон об ИИ. По правилам GPAI, поставщики высококапабельных фундаментальных моделей должны проводить состязательное тестирование перед развёртыванием, поддерживать техническую документацию, соблюдать законодательство ЕС об авторском праве и публиковать сводки обучающих данных.

Правоприменение ЕС уже активно. В первом квартале 2026 года сообщалось, что государства-члены ЕС выдали десятки штрафов на общую сумму в сотни миллионов евро, главным образом за несоблюдение требований GPAI. Сообщалось, что Ирландия, в которой расположены европейские штаб-квартиры большинства крупных американских технологических компаний, рассматривала большинство дел.

Сентябрь–Ноябрь 2025: Финальный рывок

DeepSeek опубликовала исследовательскую статью в сентябре 2025 года, которая появилась на обложке Nature — рецензируемого научного журнала, размещение на обложке которого считается одним из высших знаков научной значимости. Это был первый случай, когда техническая публикация компании в области ИИ удостоилась такого признания.

Последние месяцы года принесли каскад выпусков флагманских моделей:

12 ноября: OpenAI выпустила GPT-5.1 с улучшениями в задержке, использовании инструментов и следовании инструкциям.

17 ноября: Был выпущен Grok 4.1 от xAI.

18 ноября: Google выпустила Gemini 3 Pro — первую модель Google, претендующую на первое место в Artificial Analysis Intelligence Index, и первую модель из любой лаборатории, превысившую 1500 Elo на LMSYS Chatbot Arena.

11 декабря: OpenAI выпустила GPT-5.2, который, по сообщениям, стал одной из первых моделей, набравших более 90% на ARC-AGI-1 — бенчмарке, специально разработанном для проверки новаторских рассуждений, а не воспроизведения паттернов. Он также получил идеальный балл на AIME 2025. Вместе с моделью OpenAI запустила Codex — автономный агент программирования, предназначенный для выполнения целых инженерных задач с минимальным человеческим надзором.

Регулирование ИИ — Закон ЕС об ИИ начал генерировать реальные штрафы в начале 2026 года

2026: Граница продолжает двигаться

Первые месяцы 2026 года ускорили, а не замедлили темпы развития.

Дарио Амодеи, генеральный директор Anthropic, сказал на Всемирном экономическом форуме в Давосе в январе 2026 года, что системы уровня AGI, вероятно, появятся «в течение нескольких лет» — называя 2027 год правдоподобным горизонтом. Шейн Легг, сооснователь DeepMind, дал 50% вероятность появления «минимального AGI» к 2028 году. Это не маргинальные прогнозы; они исходят от людей, которые строят эти системы.

В апреле 2026 года Anthropic выпустила Claude Mythos 5 — модель с 10 триллионами параметров, ориентированную на кибербезопасность и продвинутое кодирование. Google выпустил Gemini 3.1 с возможностями анализа голоса и изображений в режиме реального времени и вариантом Flash-Lite, работающим в 2,5 раза быстрее своего предшественника.

23 апреля 2026 года OpenAI выпустила GPT-5.5, внутренний кодовый название которого — «Spud» — первая полностью переобученная базовая модель со времён GPT-4.5. Она набрала 85% на ARC-AGI-2 (более сложном бенчмарке-преемнике) и, по сообщениям, возглавила Artificial Analysis Intelligence Index. На OSWorld-Verified — бенчмарке, тестирующем способность ИИ автономно управлять реальными компьютерными средами, — она набрала результат в верхней части 70-процентного диапазона согласно опубликованным отчётам.

Белый дом выпустил Национальную политическую рамочную программу по искусственному интеллекту 20 марта 2026 года, предложив законодательные рекомендации по унифицированному управлению. В Соединённых Штатах пока не существует комплексного федерального закона об ИИ, тогда как Калифорния, Колорадо, Нью-Йорк, Иллинойс и Юта каждый принял или предложил собственное законодательство — создавая фрагментированную регуляторную среду, которую, по мнению технологической отрасли, делает планирование соответствия требованиям чрезвычайно сложным.

Сквозная линия

На протяжении 18 месяцев прослеживается ряд закономерностей.

Первое, история эффективности изменилась. DeepSeek продемонстрировала, что передовая производительность не требует передовых вычислительных бюджетов. Это влияет на то, кто может создавать передовой ИИ — не только три-четыре американские лаборатории с инфраструктурой на миллиарды долларов, но и небольшие команды, имеющие доступ к более эффективным методам обучения.

Второе, рассуждение стало доминирующей осью конкуренции. Переход от «что модель может выдать» к «насколько хорошо она может думать над сложными проблемами» определяет период 2025–2026 годов. Расширенное мышление, цепочка рассуждений и обучение с подкреплением на основе обратной связи от людей объединились, чтобы произвести результаты МОМ и ARC-AGI.

Третье, агентный ИИ перешёл от исследований к продукту. Claude Code, OpenAI Codex и Google Jules — не исследовательские прототипы — это развёрнутые инструменты, которые инженерные команды используют сегодня. Вопрос для 2026 года и далее не в том, может ли ИИ выполнять сложные задачи, а в том, сколько человеческого надзора эти задачи на самом деле требуют.

Четвёртое, пришло регулирование. Закон ЕС об ИИ генерирует реальные штрафы. Законы штатов в США множатся. Изменённый Закон Китая о кибербезопасности действует. Уровень управления догоняет уровень возможностей, хотя именно то, как это повлияет на развитие в ближайшие несколько лет, остаётся по-настоящему неопределённым.

Что не вызывает сомнений: темп изменений. Каким бы ни было состояние ИИ, когда вы последний раз проверяли, оно почти наверняка изменилось с тех пор.