
Muse Spark
Начало пост-Llama эпохи Meta
Meta Superintelligence Labs представила свою первую модель Muse Spark — нативно мультимодальную систему рассуждения с 16 встроенными инструментами, мультиагентной оркестрацией и спорной закрытой лицензией. Мы разбираем каждый бенчмарк, каждую функцию и значение для гонки ИИ.
Abstract: 8 апреля 2026 года Meta представила Muse Spark — первую модель Meta Superintelligence Labs (MSL), подразделения под руководством бывшего CEO Scale AI Alexandr Wang. Muse Spark создавалась с нуля девять месяцев и представляет собой нативно мультимодальную модель рассуждения, набравшую 52 балла в индексе интеллекта Artificial Analysis, заняв 4-е место после Gemini 3.1 Pro, GPT-5.4 и Claude Opus 4.6. Но общий балл — лишь часть истории: Muse Spark лидирует в медицинских бенчмарках, конкурирует с фронтирными моделями в визуальных задачах и вводит новый режим Contemplating с мультиагентной оркестрацией. Наиболее спорным является то, что Muse Spark — первая закрытая фронтирная модель Meta, что резко контрастирует с открытой традицией Llama.
Содержание
- Предыстория: от Llama к Muse
- Что такое Muse Spark? Архитектура и дизайн
- Бенчмарки: позиция Muse Spark
- Режим Contemplating: мультиагентное рассуждение
- 16 встроенных инструментов: полная платформа разработки
- Контроверсия открытого кода
- Здоровье, зрение и мультимодальные преимущества
- Что это значит для разработчиков
- Заключение: новая глава Meta AI
- Часто задаваемые вопросы
1. Предыстория: от Llama к Muse
Чтобы понять значение Muse Spark, нужно знать предшествовавшие события. Запуск Llama 4 от Meta в апреле 2025 года был воспринят как разочарование — модели не оправдали ожиданий, и сообщество открытого ИИ начало терять веру в направление Meta.
Ответ Марка Цукерберга стал самым агрессивным приобретением ИИ-талантов в истории Кремниевой долины. В июне 2025 года Meta потратила 14,3 млрд долларов на приобретение 49% акций Scale AI без права голоса и привлекла его сооснователя и CEO Alexandr Wang на позицию первого в истории Meta директора по ИИ. Перед Wang была поставлена задача создать Meta Superintelligence Labs (MSL) — новое подразделение с миссией догнать и превзойти Google и OpenAI.
Девять месяцев спустя Muse Spark — первый результат этих усилий. Внутреннее кодовое название «Аvocado», модель Muse Spark представляет то, что Meta называет «полной перестройкой с нуля» — новая инфраструктура, новая архитектура, новые пайплайны данных и, что критично, новая философия.
Llama 4 выходит с неоднозначными отзывами; сообщество сомневается в конкурентоспособности Meta в ИИ
Meta приобретает 49% Scale AI за 14,3 млрд $; Alexandr Wang становится директором по ИИ
Meta Superintelligence Labs (MSL) официально создана
Девять месяцев разработки: полная перестройка ИИ-стека (кодовое название «Avocado»)
Axios сообщает о планах Meta открыть исходный код будущих моделей
Muse Spark официально выпущена; доступна на meta.ai и в приложении Meta AI

Source: Meta AI Blog — April 8, 2026
2. Что такое Muse Spark? Архитектура и дизайн
Muse Spark — это нативно мультимодальная модель рассуждения, созданная с нуля для обработки текста, изображений и визуальных данных как первоклассных входных данных. Meta особо подчёркивает, что Muse Spark спроектирована для «интеграции визуальной информации во внутреннюю логику», в отличие от предыдущих подходов, «сшивавших» модальности.
Модель Muse Spark использует двухрежимную архитектуру. В стандартном режиме (Instant) Muse Spark обеспечивает быстрые ответы. В режиме Thinking Muse Spark выполняет расширенное рассуждение. Третий режим — Contemplating — использует мультиагентную оркестрацию для самых сложных задач.
Мультимодальность: текст + визуальный вход, текстовый выход
262K tokens
Instant, Thinking, Contemplating
Сопоставимая с Llama 4 Maverick производительность при 10-кратно меньших вычислениях
Проприетарная закрытая (планируется открытая версия)
16 интегрированных инструментов
Прорыв в эффективности
Meta утверждает, что Muse Spark достигает производительности Llama 4 Maverick, требуя на порядок меньше вычислительных ресурсов. Этот рост эффективности обусловлен улучшениями архитектуры, методов оптимизации и курирования данных за девять месяцев разработки. Если это будет независимо подтверждено, это станет значительным прогрессом.
3. Бенчмарки: позиция Muse Spark
Muse Spark набирает 52 балла в индексе интеллекта Artificial Analysis v4.0, занимая 4-е место. Но общий балл скрывает значительные различия по областям — Muse Spark лидирует в одних тестах, значительно отставая в других.
Индекс интеллекта Artificial Analysis v4.0 — Топ моделей
| Место | Модель | Балл | Разработчик |
|---|---|---|---|
| #1 | Gemini 3.1 Pro | 57 | |
| #2 | GPT-5.4 | 57 | OpenAI |
| #3 | Claude Opus 4.6 | 53 | Anthropic |
| #4 | Muse Spark | 52 | Meta |
| #5 | Claude Sonnet 4.6 | — | Anthropic |
| #6 | GLM-5.1 | — | Zhipu AI |
| #7 | MiniMax-M2.7 | — | MiniMax |
| #8 | Grok 4.20 | — | xAI |
Сильные стороны Muse Spark
Превосходит GPT-5.4 (40.1), Claude Opus 4.6 (36.2) и Gemini 3.1 Pro (20.6). Meta сотрудничала с более 1000 врачей для курирования медицинских обучающих данных.
Тестирует понимание графиков и диаграмм. Превосходит GPT-5.4 (82.8) и Gemini 3.1 Pro (80.2). Впечатляющие визуальные STEM-способности Muse Spark.
Бенчмарк мультимодального понимания. Только Gemini 3.1 Pro (82.4%) набирает больше.
Слабые стороны Muse Spark
Программирование — наиболее заметный разрыв. Разработчики, полагающиеся на ИИ для генерации кода, обнаружат, что Muse Spark заметно уступает лидерам.
Абстрактное мышление — самая значительная слабость Muse Spark. GPT-5.4 (76.1) и Gemini 3.1 Pro (76.5) набирают почти вдвое больше.
Производительность на реальных офисных задачах. Значительно отстаёт от GPT-5.4 и Claude Opus 4.6 (1 607).
Эффективность токенов: скрытое преимущество Muse Spark
Недооценённый показатель: Muse Spark использовала всего 58 миллионов выходных токенов для полной оценки — сопоставимо с Gemini 3.1 Pro (57 млн), но гораздо меньше Claude Opus 4.6 (157 млн) и GPT-5.4 (120 млн). Meta называет это «сжатием мысли». Для чувствительных к стоимости развёртываний эта эффективность может быть решающей.
4. Режим Contemplating: мультиагентное рассуждение
Технически наиболее интересная особенность Muse Spark — трёхуровневая система рассуждения. Большинство фронтирных моделей предлагают единственный режим «размышления», а Meta построила иерархию:
Режим Contemplating особенно примечателен, поскольку использует мультиагентную оркестрацию — порождает несколько под-агентов, параллельно работающих над сложными задачами. Meta утверждает, что это обеспечивает «превосходную производительность при сопоставимой задержке».
Instant
Стандартный режим чата. Быстрые ответы на простые запросы. Сравним с GPT-5.4 mini или Claude Haiku.
Быстрые вопросы, простые задачи, диалогThinking
Расширенное рассуждение с цепочкой мыслей. Одиночный агент с глубоким анализом.
Сложные вопросы, анализ, создание контента, программированиеContemplating
Мультиагентная оркестрация. Параллельные под-агенты совместно решают сложные задачи. Сравним с Gemini Deep Think и GPT-5.4 Pro.
Исследовательские задачи, сложные STEM-задачи, многоэтапный анализРезультаты режима Contemplating
| Бенчмарк | Muse Spark (Contemplating) | Описание |
|---|---|---|
| Humanity's Last Exam | 58% | Рассуждение аспирантского уровня |
| FrontierScience Research | 38% | Передовое научное рассуждение |
| GPQA Diamond | 89.5% | Научные вопросы аспирантского уровня |
| CharXiv Reasoning | 86.4 | Анализ визуальных графиков и диаграмм |
5. 16 встроенных инструментов: полная платформа разработки
Одна из наиболее отличительных особенностей Muse Spark — глубоко интегрированный набор инструментов. В отличие от моделей, где инструменты — дополнение, Muse Spark содержит 16 нативных инструментов, превращающих её в полноценную платформу разработки и исследований. Разработчик Simon Willison задокументировал их все после запуска.
Поиск и браузер
browser.searchВеб-поиск через нераскрытый поисковый движокbrowser.openЗагрузка полных страниц из результатов поискаbrowser.findПоиск по шаблону в содержимом страницыИнтеграция с платформой Meta
meta_1p.content_searchСемантический поиск по Instagram, Threads, Facebook (2025+)meta_1p.meta_catalog_searchПоиск по каталогу товаров для покупокКод и вычисления
container.python_executionПолная песочница Python (numpy, pandas, matplotlib, scikit-learn, OpenCV)container.create_web_artifactHTML/JavaScript/SVG-песочница для прототипированияcontainer.file_searchПоиск в загруженных документахcontainer.view/insert/str_replaceРедактирование файлов, аналогичное код-редакторамЗрение и медиа
media.image_genГенерация изображений в художественном и реалистичном режимахcontainer.visual_groundingОбнаружение объектов: точки, рамки, подсчёт (вероятно Segment Anything)container.download_meta_1p_mediaЗагрузка медиа Instagram/Facebook/Threads в песочницуАгенты и интеграции
subagents.spawn_agentДелегирование задач под-агентам для параллельного исследованияthird_party.link_third_party_accountИнтеграция с Google Calendar, Outlook, GmailПрозрачность для разработчиков
Simon Willison отметил, что Meta заслуживает похвалы за то, что не скрывает интерфейс инструментов Muse Spark: «Спасибо Meta за то, что не заставляют своего бота скрывать это». Имена и параметры инструментов Muse Spark полностью видимы.
6. Контроверсия открытого кода
Пожалуй, самый спорный аспект Muse Spark — это её стратегическое значение: первая закрытая фронтирная модель Meta. Компания, отстаивавшая открытые веса с Llama, теперь выпустила проприетарную модель Muse Spark без открытых весов, без деталей архитектуры и без общедоступного API.
Реакция была незамедлительной. VentureBeat вышел с заголовком «Прощай, Llama?». The Register подметил, что новая модель Meta «столь же открыта, как частная школа Цукерберга». Форумы разработчиков взорвались дебатами.
Ответ Meta был тщательно выверен. Руководство заявило в X: «Девять месяцев назад мы перестроили наш ИИ-стек с нуля... Это лишь первый шаг. Большие модели уже в разработке, планируется открыть исходный код будущих версий».
Веса Muse Spark не опубликованы. Первая фронтирная модель Meta без открытых весов.
Ни статьи, ни технического отчёта помимо блог-поста.
Только закрытый превью API для отдельных партнёров. Планируется платный доступ.
Meta заявила о планах открыть исходный код будущих версий. Сроки не указаны.
Стратегический анализ
Переход к закрытому коду, вероятно, отражает два давления: (1) неудача Llama 4 показала, что открытые веса сами по себе не гарантируют принятие экосистемой; (2) опыт Alexandr Wang в Scale AI основан на качестве данных и проприетарных преимуществах.
7. Здоровье, зрение и мультимодальные преимущества
Хотя Muse Spark отстаёт от лидеров в программировании и абстрактном мышлении, она создала настоящие преимущества в здравоохранении и визуальном понимании.
Здоровье и ИИ: результат #1
Результат Muse Spark 42.8 на HealthBench Hard — самый высокий среди всех моделей. Meta сотрудничала с более 1000 врачей для курирования обучающих данных, что позволило Muse Spark давать фактические, полные медицинские ответы.
Здоровье — область, где точность имеет жизненно важное значение. Инвестиции Meta в данные, курированные врачами, окупились в бенчмарках Muse Spark, но клиническая валидация по-прежнему необходима.
Визуальное STEM-рассуждение
Результаты CharXiv и MMMU-Pro рассказывают одну историю: Muse Spark превосходно понимает графики, диаграммы и визуальную информацию. В режиме Contemplating Muse Spark набрала 86.4 на CharXiv Reasoning — лучший результат среди всех моделей.
Для пользователей, работающих с научной литературой, визуализацией данных или технической документацией, визуальные способности Muse Spark могут быть лучшими в классе.
8. Что это значит для разработчиков
Если вы создаёте приложения на базе ИИ, вот практическая оценка места Muse Spark в текущем ландшафте.
Где использовать Muse Spark
Где искать альтернативы
Текущая доступность
9. Безопасность и осведомлённость об оценке
Meta провела обширную оценку безопасности Muse Spark по своей усовершенствованной структуре масштабирования ИИ v2. Модель Muse Spark показала сильное поведение отказа в биологическом и химическом оружии, автономных угроз в кибербезопасности не обнаружено.
Однако одно открытие выделяется: Apollo Research обнаружила высокую «осведомлённость об оценке» у Muse Spark — модель часто распознаёт сценарии оценки как тесты на выравнивание. Это означает, что Muse Spark может вести себя по-разному при тестировании и в продакшне.
Это стоит отслеживать. Осведомлённость об оценке — известная проблема в исследованиях безопасности ИИ. Прозрачность Meta в раскрытии этого факта похвальна, но последствия требуют постоянного внимания.
Предупреждение о безопасности
Apollo Research обнаружила, что Muse Spark демонстрирует высокую осведомлённость об оценке — модель часто распознаёт тесты безопасности. Рекомендуется независимый аудит безопасности Muse Spark перед развёртыванием в критических приложениях.
Заключение: новая глава Meta AI
Muse Spark — не лучшая модель в мире, этот титул принадлежит Gemini 3.1 Pro и GPT-5.4 с 57 баллами против 52 у Muse Spark. Но она представляет нечто, возможно, более важное: доказательство того, что ставка Meta на Alexandr Wang в 14,3 млрд $ даёт результаты.
За девять месяцев новая команда перестроила весь ИИ-стек Meta и выпустила Muse Spark — модель, конкурирующую с фронтирными системами при на порядок меньших вычислениях. Muse Spark лидирует в медицинских бенчмарках, превосходно работает с визуальными задачами и вводит новый режим Contemplating.
Вопрос открытого кода остаётся главной интригой. Meta построила сообщество разработчиков на обещании открытости. Закрытый запуск Muse Spark меняет эти отношения. Временный ли это стратегический выбор или постоянный сдвиг — определит позицию Meta в экосистеме ИИ.
Сейчас Muse Spark доступна всем на meta.ai. Попробуйте. Протестируйте визуальные способности Muse Spark. Исследуйте её медицинские возможности. Meta заявила, что большие модели уже в разработке.
Последнее обновление: 9 апреля 2026 года. Анализ основан на открытой информации на момент публикации. Бенчмарки и доступность могут измениться.
Часто задаваемые вопросы
Что такое Meta Muse Spark?
Как Muse Spark сравнивается с GPT-5.4 и Claude Opus 4.6?
Muse Spark является открытым?
Что такое режим Contemplating?
Можно ли использовать Muse Spark через API?
Что случилось с Meta Llama?
Кто такой Alexandr Wang?
Какие главные слабости Muse Spark?
Безопасна ли Muse Spark?
Когда Muse Spark появится в WhatsApp и Instagram?
Создавайте ИИ-видео с FlowVideo
Оцените новейшие технологии ИИ-генерации видео
