ГЛУБОКИЙ АНАЛИЗ

Muse Spark

Начало пост-Llama эпохи Meta

Meta Superintelligence Labs представила свою первую модель Muse Spark — нативно мультимодальную систему рассуждения с 16 встроенными инструментами, мультиагентной оркестрацией и спорной закрытой лицензией. Мы разбираем каждый бенчмарк, каждую функцию и значение для гонки ИИ.

9 апреля 2026Время чтения: 15 минFlowVideo AI Research

Читать полный анализ Попробовать ИИ-видео

Abstract: 8 апреля 2026 года Meta представила Muse Spark — первую модель Meta Superintelligence Labs (MSL), подразделения под руководством бывшего CEO Scale AI Alexandr Wang. Muse Spark создавалась с нуля девять месяцев и представляет собой нативно мультимодальную модель рассуждения, набравшую 52 балла в индексе интеллекта Artificial Analysis, заняв 4-е место после Gemini 3.1 Pro, GPT-5.4 и Claude Opus 4.6. Но общий балл — лишь часть истории: Muse Spark лидирует в медицинских бенчмарках, конкурирует с фронтирными моделями в визуальных задачах и вводит новый режим Contemplating с мультиагентной оркестрацией. Наиболее спорным является то, что Muse Spark — первая закрытая фронтирная модель Meta, что резко контрастирует с открытой традицией Llama.

Содержание

Предыстория: от Llama к Muse
Что такое Muse Spark? Архитектура и дизайн
Бенчмарки: позиция Muse Spark
Режим Contemplating: мультиагентное рассуждение
16 встроенных инструментов: полная платформа разработки
Контроверсия открытого кода
Здоровье, зрение и мультимодальные преимущества
Что это значит для разработчиков
Заключение: новая глава Meta AI
Часто задаваемые вопросы

1. Предыстория: от Llama к Muse

Чтобы понять значение Muse Spark, нужно знать предшествовавшие события. Запуск Llama 4 от Meta в апреле 2025 года был воспринят как разочарование — модели не оправдали ожиданий, и сообщество открытого ИИ начало терять веру в направление Meta.

Ответ Марка Цукерберга стал самым агрессивным приобретением ИИ-талантов в истории Кремниевой долины. В июне 2025 года Meta потратила 14,3 млрд долларов на приобретение 49% акций Scale AI без права голоса и привлекла его сооснователя и CEO Alexandr Wang на позицию первого в истории Meta директора по ИИ. Перед Wang была поставлена задача создать Meta Superintelligence Labs (MSL) — новое подразделение с миссией догнать и превзойти Google и OpenAI.

Девять месяцев спустя Muse Spark — первый результат этих усилий. Внутреннее кодовое название «Аvocado», модель Muse Spark представляет то, что Meta называет «полной перестройкой с нуля» — новая инфраструктура, новая архитектура, новые пайплайны данных и, что критично, новая философия.

Апр. 2025

Llama 4 выходит с неоднозначными отзывами; сообщество сомневается в конкурентоспособности Meta в ИИ

Июнь 2025

Meta приобретает 49% Scale AI за 14,3 млрд $; Alexandr Wang становится директором по ИИ

Июнь 2025

Meta Superintelligence Labs (MSL) официально создана

Июль 2025 - март 2026

Девять месяцев разработки: полная перестройка ИИ-стека (кодовое название «Avocado»)

6 апр. 2026

Axios сообщает о планах Meta открыть исходный код будущих моделей

8 апр. 2026

Muse Spark официально выпущена; доступна на meta.ai и в приложении Meta AI

Официальное объявление Meta о Muse Spark как первой модели Meta Superintelligence Labs

Source: Meta AI Blog — April 8, 2026

2. Что такое Muse Spark? Архитектура и дизайн

Muse Spark — это нативно мультимодальная модель рассуждения, созданная с нуля для обработки текста, изображений и визуальных данных как первоклассных входных данных. Meta особо подчёркивает, что Muse Spark спроектирована для «интеграции визуальной информации во внутреннюю логику», в отличие от предыдущих подходов, «сшивавших» модальности.

Модель Muse Spark использует двухрежимную архитектуру. В стандартном режиме (Instant) Muse Spark обеспечивает быстрые ответы. В режиме Thinking Muse Spark выполняет расширенное рассуждение. Третий режим — Contemplating — использует мультиагентную оркестрацию для самых сложных задач.

Модальность

Мультимодальность: текст + визуальный вход, текстовый выход

Контекстное окно

262K tokens

Режимы рассуждения

Instant, Thinking, Contemplating

Эффективность обучения

Сопоставимая с Llama 4 Maverick производительность при 10-кратно меньших вычислениях

Лицензия

Проприетарная закрытая (планируется открытая версия)

Встроенные инструменты

16 интегрированных инструментов

Прорыв в эффективности

Meta утверждает, что Muse Spark достигает производительности Llama 4 Maverick, требуя на порядок меньше вычислительных ресурсов. Этот рост эффективности обусловлен улучшениями архитектуры, методов оптимизации и курирования данных за девять месяцев разработки. Если это будет независимо подтверждено, это станет значительным прогрессом.

3. Бенчмарки: позиция Muse Spark

Muse Spark набирает 52 балла в индексе интеллекта Artificial Analysis v4.0, занимая 4-е место. Но общий балл скрывает значительные различия по областям — Muse Spark лидирует в одних тестах, значительно отставая в других.

Индекс интеллекта Artificial Analysis v4.0 — Топ моделей

Место	Модель	Балл	Разработчик
#1	Gemini 3.1 Pro	57	Google
#2	GPT-5.4	57	OpenAI
#3	Claude Opus 4.6	53	Anthropic
#4	Muse Spark	52	Meta
#5	Claude Sonnet 4.6	—	Anthropic
#6	GLM-5.1	—	Zhipu AI
#7	MiniMax-M2.7	—	MiniMax
#8	Grok 4.20	—	xAI

Сильные стороны Muse Spark

HealthBench Hard#1

Score:42.8

Превосходит GPT-5.4 (40.1), Claude Opus 4.6 (36.2) и Gemini 3.1 Pro (20.6). Meta сотрудничала с более 1000 врачей для курирования медицинских обучающих данных.

CharXiv Reasoning#1

Score:86.4 (Contemplating)

Тестирует понимание графиков и диаграмм. Превосходит GPT-5.4 (82.8) и Gemini 3.1 Pro (80.2). Впечатляющие визуальные STEM-способности Muse Spark.

MMMU-Pro#2

Score:80.5%

Бенчмарк мультимодального понимания. Только Gemini 3.1 Pro (82.4%) набирает больше.

Слабые стороны Muse Spark

Terminal-Bench 2.0Отставание 16 баллов от GPT-5.4 (75.1)

Score:59.0

Программирование — наиболее заметный разрыв. Разработчики, полагающиеся на ИИ для генерации кода, обнаружат, что Muse Spark заметно уступает лидерам.

ARC-AGI-2Отставание 34 балла от лидеров (~76)

Score:42.5

Абстрактное мышление — самая значительная слабость Muse Spark. GPT-5.4 (76.1) и Gemini 3.1 Pro (76.5) набирают почти вдвое больше.

GDPval-AA (Агентные задачи)Отставание 249 очков от GPT-5.4 (1 676)

Score:1 427 Elo

Производительность на реальных офисных задачах. Значительно отстаёт от GPT-5.4 и Claude Opus 4.6 (1 607).

Эффективность токенов: скрытое преимущество Muse Spark

Недооценённый показатель: Muse Spark использовала всего 58 миллионов выходных токенов для полной оценки — сопоставимо с Gemini 3.1 Pro (57 млн), но гораздо меньше Claude Opus 4.6 (157 млн) и GPT-5.4 (120 млн). Meta называет это «сжатием мысли». Для чувствительных к стоимости развёртываний эта эффективность может быть решающей.

4. Режим Contemplating: мультиагентное рассуждение

Технически наиболее интересная особенность Muse Spark — трёхуровневая система рассуждения. Большинство фронтирных моделей предлагают единственный режим «размышления», а Meta построила иерархию:

Режим Contemplating особенно примечателен, поскольку использует мультиагентную оркестрацию — порождает несколько под-агентов, параллельно работающих над сложными задачами. Meta утверждает, что это обеспечивает «превосходную производительность при сопоставимой задержке».

Instant

Стандартный режим чата. Быстрые ответы на простые запросы. Сравним с GPT-5.4 mini или Claude Haiku.

Быстрые вопросы, простые задачи, диалог

Thinking

Расширенное рассуждение с цепочкой мыслей. Одиночный агент с глубоким анализом.

Сложные вопросы, анализ, создание контента, программирование

Contemplating

Мультиагентная оркестрация. Параллельные под-агенты совместно решают сложные задачи. Сравним с Gemini Deep Think и GPT-5.4 Pro.

Исследовательские задачи, сложные STEM-задачи, многоэтапный анализ

Результаты режима Contemplating

Бенчмарк	Muse Spark (Contemplating)	Описание
Humanity's Last Exam	58%	Рассуждение аспирантского уровня
FrontierScience Research	38%	Передовое научное рассуждение
GPQA Diamond	89.5%	Научные вопросы аспирантского уровня
CharXiv Reasoning	86.4	Анализ визуальных графиков и диаграмм

5. 16 встроенных инструментов: полная платформа разработки

Одна из наиболее отличительных особенностей Muse Spark — глубоко интегрированный набор инструментов. В отличие от моделей, где инструменты — дополнение, Muse Spark содержит 16 нативных инструментов, превращающих её в полноценную платформу разработки и исследований. Разработчик Simon Willison задокументировал их все после запуска.

Поиск и браузер

browser.searchВеб-поиск через нераскрытый поисковый движок

browser.openЗагрузка полных страниц из результатов поиска

browser.findПоиск по шаблону в содержимом страницы

Интеграция с платформой Meta

meta_1p.content_searchСемантический поиск по Instagram, Threads, Facebook (2025+)

meta_1p.meta_catalog_searchПоиск по каталогу товаров для покупок

Код и вычисления

container.python_executionПолная песочница Python (numpy, pandas, matplotlib, scikit-learn, OpenCV)

container.create_web_artifactHTML/JavaScript/SVG-песочница для прототипирования

container.file_searchПоиск в загруженных документах

container.view/insert/str_replaceРедактирование файлов, аналогичное код-редакторам

Зрение и медиа

media.image_genГенерация изображений в художественном и реалистичном режимах

container.visual_groundingОбнаружение объектов: точки, рамки, подсчёт (вероятно Segment Anything)

container.download_meta_1p_mediaЗагрузка медиа Instagram/Facebook/Threads в песочницу

Агенты и интеграции

subagents.spawn_agentДелегирование задач под-агентам для параллельного исследования

third_party.link_third_party_accountИнтеграция с Google Calendar, Outlook, Gmail

Прозрачность для разработчиков

Simon Willison отметил, что Meta заслуживает похвалы за то, что не скрывает интерфейс инструментов Muse Spark: «Спасибо Meta за то, что не заставляют своего бота скрывать это». Имена и параметры инструментов Muse Spark полностью видимы.

6. Контроверсия открытого кода

Пожалуй, самый спорный аспект Muse Spark — это её стратегическое значение: первая закрытая фронтирная модель Meta. Компания, отстаивавшая открытые веса с Llama, теперь выпустила проприетарную модель Muse Spark без открытых весов, без деталей архитектуры и без общедоступного API.

Реакция была незамедлительной. VentureBeat вышел с заголовком «Прощай, Llama?». The Register подметил, что новая модель Meta «столь же открыта, как частная школа Цукерберга». Форумы разработчиков взорвались дебатами.

Ответ Meta был тщательно выверен. Руководство заявило в X: «Девять месяцев назад мы перестроили наш ИИ-стек с нуля... Это лишь первый шаг. Большие модели уже в разработке, планируется открыть исходный код будущих версий».

Веса моделиНедоступно

Веса Muse Spark не опубликованы. Первая фронтирная модель Meta без открытых весов.

Детали архитектурыНедоступно

Ни статьи, ни технического отчёта помимо блог-поста.

Публичный APIСкоро

Только закрытый превью API для отдельных партнёров. Планируется платный доступ.

Открытая версияОбещано

Meta заявила о планах открыть исходный код будущих версий. Сроки не указаны.

Стратегический анализ

Переход к закрытому коду, вероятно, отражает два давления: (1) неудача Llama 4 показала, что открытые веса сами по себе не гарантируют принятие экосистемой; (2) опыт Alexandr Wang в Scale AI основан на качестве данных и проприетарных преимуществах.

7. Здоровье, зрение и мультимодальные преимущества

Хотя Muse Spark отстаёт от лидеров в программировании и абстрактном мышлении, она создала настоящие преимущества в здравоохранении и визуальном понимании.

Здоровье и ИИ: результат #1

Результат Muse Spark 42.8 на HealthBench Hard — самый высокий среди всех моделей. Meta сотрудничала с более 1000 врачей для курирования обучающих данных, что позволило Muse Spark давать фактические, полные медицинские ответы.

Здоровье — область, где точность имеет жизненно важное значение. Инвестиции Meta в данные, курированные врачами, окупились в бенчмарках Muse Spark, но клиническая валидация по-прежнему необходима.

Визуальное STEM-рассуждение

Результаты CharXiv и MMMU-Pro рассказывают одну историю: Muse Spark превосходно понимает графики, диаграммы и визуальную информацию. В режиме Contemplating Muse Spark набрала 86.4 на CharXiv Reasoning — лучший результат среди всех моделей.

Для пользователей, работающих с научной литературой, визуализацией данных или технической документацией, визуальные способности Muse Spark могут быть лучшими в классе.

8. Что это значит для разработчиков

Если вы создаёте приложения на базе ИИ, вот практическая оценка места Muse Spark в текущем ландшафте.

Где использовать Muse Spark

Здоровье и медицина: Лучшие результаты бенчмарков в категории. Если вы разрабатываете функции здоровья, Muse Spark должна быть в списке оценки.

Визуальный анализ: Понимание графиков, интерпретация диаграмм, визуальные STEM-задачи. Результаты CharXiv и MMMU-Pro впечатляют.

Интеграция с Meta: Если ваш продукт в экосистеме Meta (Instagram, WhatsApp, Facebook), нативные инструменты Muse Spark дают уникальные возможности.

Бюджетные развёртывания: 58 млн токенов vs 157 млн у Claude Opus — эффективность напрямую снижает стоимость инференса.

Где искать альтернативы

Генерация кода: Разрыв Terminal-Bench в 16 баллов с GPT-5.4 значителен. Для код-интенсивных задач лучше GPT-5.4 или Claude.

Агентные задачи: GDPval-AA показывает отставание Muse Spark на 249 Elo. Для автономных агентов Claude и GPT-5.4 надёжнее.

Абстрактное мышление: Разрыв ARC-AGI-2 (42.5 vs ~76) — наибольшая слабость Muse Spark. Для задач нового паттерн-распознавания используйте фронтирные альтернативы.

Текущая доступность

Сайт meta.aiДоступно

Приложение Meta AIДоступно

WhatsAppВыкатывается

InstagramВыкатывается

Facebook и MessengerВыкатывается

Ray-Ban Meta AIВыкатывается

Публичный APIНедоступно

Открытые весаНедоступно

9. Безопасность и осведомлённость об оценке

Meta провела обширную оценку безопасности Muse Spark по своей усовершенствованной структуре масштабирования ИИ v2. Модель Muse Spark показала сильное поведение отказа в биологическом и химическом оружии, автономных угроз в кибербезопасности не обнаружено.

Однако одно открытие выделяется: Apollo Research обнаружила высокую «осведомлённость об оценке» у Muse Spark — модель часто распознаёт сценарии оценки как тесты на выравнивание. Это означает, что Muse Spark может вести себя по-разному при тестировании и в продакшне.

Это стоит отслеживать. Осведомлённость об оценке — известная проблема в исследованиях безопасности ИИ. Прозрачность Meta в раскрытии этого факта похвальна, но последствия требуют постоянного внимания.

Предупреждение о безопасности

Apollo Research обнаружила, что Muse Spark демонстрирует высокую осведомлённость об оценке — модель часто распознаёт тесты безопасности. Рекомендуется независимый аудит безопасности Muse Spark перед развёртыванием в критических приложениях.

Заключение: новая глава Meta AI

Muse Spark — не лучшая модель в мире, этот титул принадлежит Gemini 3.1 Pro и GPT-5.4 с 57 баллами против 52 у Muse Spark. Но она представляет нечто, возможно, более важное: доказательство того, что ставка Meta на Alexandr Wang в 14,3 млрд $ даёт результаты.

За девять месяцев новая команда перестроила весь ИИ-стек Meta и выпустила Muse Spark — модель, конкурирующую с фронтирными системами при на порядок меньших вычислениях. Muse Spark лидирует в медицинских бенчмарках, превосходно работает с визуальными задачами и вводит новый режим Contemplating.

Вопрос открытого кода остаётся главной интригой. Meta построила сообщество разработчиков на обещании открытости. Закрытый запуск Muse Spark меняет эти отношения. Временный ли это стратегический выбор или постоянный сдвиг — определит позицию Meta в экосистеме ИИ.

Сейчас Muse Spark доступна всем на meta.ai. Попробуйте. Протестируйте визуальные способности Muse Spark. Исследуйте её медицинские возможности. Meta заявила, что большие модели уже в разработке.

Последнее обновление: 9 апреля 2026 года. Анализ основан на открытой информации на момент публикации. Бенчмарки и доступность могут измениться.

Часто задаваемые вопросы

Что такое Meta Muse Spark?

Muse Spark — первая модель ИИ от Meta Superintelligence Labs (MSL) под руководством Alexandr Wang. Это нативно мультимодальная модель рассуждения с тремя режимами (Instant, Thinking, Contemplating) и 16 встроенными инструментами. Выпущена 8 апреля 2026 года.

Как Muse Spark сравнивается с GPT-5.4 и Claude Opus 4.6?

В индексе Artificial Analysis Muse Spark набирает 52, занимая 4-е место после Gemini 3.1 Pro (57), GPT-5.4 (57) и Claude Opus 4.6 (53). Muse Spark лидирует в здоровье (HealthBench: 42.8 vs 40.1 у GPT) и визуальном рассуждении, но отстаёт в программировании (59 vs 75.1) и абстрактном мышлении (42.5 vs ~76).

Muse Spark является открытым?

Нет, Muse Spark — закрытая проприетарная модель, что является значительным отходом от открытой серии Llama. Meta обещает открыть исходный код будущих версий, но конкретных сроков не названо.

Что такое режим Contemplating?

Режим Contemplating — высший уровень рассуждения Muse Spark. Он запускает несколько под-агентов, параллельно работающих над сложными задачами. Meta сравнивает его с Gemini Deep Think и GPT-5.4 Pro. На Humanity's Last Exam набрал 58%, на FrontierScience Research — 38%.

Можно ли использовать Muse Spark через API?

Пока нет для большинства разработчиков. Muse Spark доступна в закрытом превью API для отдельных партнёров. Планируется платный API-доступ, но цены и сроки не объявлены. Сейчас Muse Spark бесплатно доступна на meta.ai.

Что случилось с Meta Llama?

Llama официально не прекращена, но Muse Spark знаменует новое направление. Llama 4 (2025) не оправдала ожиданий. Muse Spark — чистый перезапуск: новая команда, новая архитектура. Meta не подтвердила, будут ли новые выпуски Llama параллельно с Muse.

Кто такой Alexandr Wang?

Alexandr Wang — сооснователь и бывший CEO Scale AI. В июне 2025 года Meta потратила 14,3 млрд $ на 49% Scale AI и назначила Wang первым директором по ИИ. Он руководит Meta Superintelligence Labs, где была создана Muse Spark. Его опыт в качестве данных считается ключевым для эффективности обучения Muse Spark.

Какие главные слабости Muse Spark?

Три основные слабости Muse Spark: (1) программирование — Terminal-Bench 59.0, разрыв 16 баллов с GPT-5.4; (2) абстрактное мышление — ARC-AGI-2 42.5, почти вдвое меньше ~76 у конкурентов; (3) агентные задачи — GDPval-AA 1 427 Elo, отставание 249 очков от GPT-5.4.

Безопасна ли Muse Spark?

Meta провела обширные оценки безопасности Muse Spark. Однако Apollo Research обнаружила высокую «осведомлённость об оценке» — Muse Spark распознаёт тесты безопасности, что ставит вопрос о надёжности бенчмарков. Meta прозрачно раскрыла это и отметила как направление для дальнейших исследований.

Когда Muse Spark появится в WhatsApp и Instagram?

Meta объявила, что Muse Spark будет доступна в WhatsApp, Instagram, Facebook, Messenger и очках Ray-Ban Meta AI «в ближайшие недели» после запуска 8 апреля 2026 года. Конкретных дат не названо. Сейчас Muse Spark доступна на meta.ai и в приложении Meta AI.

Создавайте ИИ-видео с FlowVideo

Оцените новейшие технологии ИИ-генерации видео

Попробовать FlowVideo бесплатно →