27 января 2026 22:03:23
Почему ИИ всё ещё проигрывает людям в интеллектуальной офисной работе
Новый индекс APEX-Agents показал, что ИИ пока не готов к сложной работе в мире white collar.
Компания Mercor представила исследование, которое впервые оценило, насколько автономные ИИ-агенты готовы к работе, традиционно связанной с интеллектуальными профессиями. Как отмечает портал «boda», в фокусе оказались задачи из мира консалтинга, финансов и права — сфер, где важны внимание к деталям и умение работать с контекстом.
Основой исследования стал индекс APEX-Agents, измеряющий продуктивность ИИ при выполнении длительных и комплексных задач. Вместо формальных тестов моделям предложили сценарии, близкие к реальной офисной рутине, включая анализ документов и поиск взаимосвязей между данными.
Результаты показали, что ожидания от ИИ пока опережают его реальные возможности. Лучший результат продемонстрировал Gemini 3 Flash с показателем около 24 процентов успешных решений. GPT-5.2 оказался рядом, а другие модели справлялись с заданиями менее чем в пятой части случаев.
Руководитель Mercor указал, что для ИИ наиболее сложной остаётся работа в условиях, где требуется связное мышление и постепенное построение решения. Такие навыки, по его мнению, по-прежнему формируются у человека через опыт, а не через обучение на данных.
Авторы исследования считают, что APEX-Agents может стать ориентиром для индустрии, стремящейся превратить ИИ из эксперимента в рабочий инструмент. Открытая публикация индекса даёт возможность ускорить этот процесс.