27 января 2026 22:03:23

Почему ИИ всё ещё проигрывает людям в интеллектуальной офисной работе

Новый индекс APEX-Agents показал, что ИИ пока не готов к сложной работе в мире white collar.

Компания Mercor представила исследование, которое впервые оценило, насколько автономные ИИ-агенты готовы к работе, традиционно связанной с интеллектуальными профессиями. Как отмечает портал «boda», в фокусе оказались задачи из мира консалтинга, финансов и права — сфер, где важны внимание к деталям и умение работать с контекстом.

Основой исследования стал индекс APEX-Agents, измеряющий продуктивность ИИ при выполнении длительных и комплексных задач. Вместо формальных тестов моделям предложили сценарии, близкие к реальной офисной рутине, включая анализ документов и поиск взаимосвязей между данными.

Результаты показали, что ожидания от ИИ пока опережают его реальные возможности. Лучший результат продемонстрировал Gemini 3 Flash с показателем около 24 процентов успешных решений. GPT-5.2 оказался рядом, а другие модели справлялись с заданиями менее чем в пятой части случаев.

Руководитель Mercor указал, что для ИИ наиболее сложной остаётся работа в условиях, где требуется связное мышление и постепенное построение решения. Такие навыки, по его мнению, по-прежнему формируются у человека через опыт, а не через обучение на данных.

Авторы исследования считают, что APEX-Agents может стать ориентиром для индустрии, стремящейся превратить ИИ из эксперимента в рабочий инструмент. Открытая публикация индекса даёт возможность ускорить этот процесс.