Технологии

Новые AI-инструменты Microsoft: как технологии меняют звук, визуал и контент

Microsoft представила три модели ИИ, которые создают голос, изображения и текст в рамках одной цифровой экосистемы.

Автор: Татьяна Лытенкова

03 апреля 2026

Фото: Generated by DALL·E

Microsoft расширяет своё присутствие в сфере искусственного интеллекта и представляет три новые модели, ориентированные на создание и обработку разных типов контента, сообщает «Центральная Служба Новостей».

Компания делает акцент на технологиях, которые объединяют текст, звук и изображение. Такой подход позволяет создавать более гибкие цифровые инструменты для работы и творчества. Несмотря на сотрудничество с OpenAI, Microsoft продолжает развивать собственные решения.

Разработкой занималось подразделение Microsoft AI, созданное в конце 2025 года под руководством Мустафы Сулеймана.

  • MAI-Transcribe-1 помогает распознавать речь на 25 языках и быстрее обрабатывает аудио по сравнению с предыдущими решениями.
  • MAI-Voice-1 создаёт звук и позволяет формировать индивидуальные голоса, что открывает возможности для подкастов, видео и цифровых ассистентов.
  • MAI-Image-2 генерирует изображения и видео, что может использоваться в дизайне, рекламе и медиа.

Ранее технологии тестировались в MAI Playground, а теперь стали доступны через платформу Microsoft Foundry. При этом часть функций остаётся в тестовой среде.

В компании отмечают, что ориентируются на реальные сценарии использования технологий. Речь идёт о том, как пользователи создают контент, работают с медиа и взаимодействуют с цифровыми сервисами.

Microsoft продолжает инвестировать в развитие искусственного интеллекта и интегрировать его в свои продукты. Объём вложений в это направление уже превысил 13 млрд долларов.