Технологии
Новые AI-инструменты Microsoft: как технологии меняют звук, визуал и контент
Microsoft представила три модели ИИ, которые создают голос, изображения и текст в рамках одной цифровой экосистемы.
Автор: Татьяна Лытенкова
03 апреля 2026
Фото: Generated by DALL·E
Microsoft расширяет своё присутствие в сфере искусственного интеллекта и представляет три новые модели, ориентированные на создание и обработку разных типов контента, сообщает «Центральная Служба Новостей».
Компания делает акцент на технологиях, которые объединяют текст, звук и изображение. Такой подход позволяет создавать более гибкие цифровые инструменты для работы и творчества. Несмотря на сотрудничество с OpenAI, Microsoft продолжает развивать собственные решения.
Разработкой занималось подразделение Microsoft AI, созданное в конце 2025 года под руководством Мустафы Сулеймана.
- MAI-Transcribe-1 помогает распознавать речь на 25 языках и быстрее обрабатывает аудио по сравнению с предыдущими решениями.
- MAI-Voice-1 создаёт звук и позволяет формировать индивидуальные голоса, что открывает возможности для подкастов, видео и цифровых ассистентов.
- MAI-Image-2 генерирует изображения и видео, что может использоваться в дизайне, рекламе и медиа.
Ранее технологии тестировались в MAI Playground, а теперь стали доступны через платформу Microsoft Foundry. При этом часть функций остаётся в тестовой среде.
В компании отмечают, что ориентируются на реальные сценарии использования технологий. Речь идёт о том, как пользователи создают контент, работают с медиа и взаимодействуют с цифровыми сервисами.
Microsoft продолжает инвестировать в развитие искусственного интеллекта и интегрировать его в свои продукты. Объём вложений в это направление уже превысил 13 млрд долларов.