ANALYSE APPROFONDIE

Muse Spark

L'ère post-Llama de Meta commence

Meta Superintelligence Labs vient de publier son premier modèle — un système de raisonnement nativement multimodal doté de 16 outils intégrés, d'une orchestration multi-agents et d'une licence propriétaire controversée. Nous décryptons chaque benchmark, chaque fonctionnalité, et ce que cela implique pour la course à l'IA.

9 avril 2026Lecture de 15 minFlowVideo AI Research

Lire l'analyse complète Essayer les outils vidéo IA

Abstract: Le 8 avril 2026, Meta a publié Muse Spark — le premier modèle issu de Meta Superintelligence Labs (MSL), l'unité dirigée par Alexandr Wang, ancien PDG de Scale AI. Développé de zéro en neuf mois, Muse Spark est un modèle de raisonnement nativement multimodal qui obtient un score de 52 sur l'Artificial Analysis Intelligence Index, le plaçant en 4e position derrière Gemini 3.1 Pro, GPT-5.4 et Claude Opus 4.6. Mais les chiffres agrégés ne racontent qu'une partie de l'histoire : Muse Spark domine les benchmarks de santé, rivalise avec les modèles de pointe dans les tâches visuelles, et introduit un mode Contemplating inédit avec orchestration multi-agents. Le fait le plus controversé est que Muse Spark est le premier modèle propriétaire de Meta au niveau frontier — une rupture spectaculaire avec la tradition des poids ouverts de la série Llama.

1. Contexte : De Llama à Muse

Pour comprendre l'importance de Muse Spark, il faut comprendre les turbulences qui l'ont précédé. Le lancement de Llama 4 en avril 2025 a été largement perçu comme une déception — les modèles ont sous-performé par rapport aux attentes, et la communauté IA open source, qui s'était mobilisée derrière Llama, a commencé à perdre confiance dans la direction IA de Meta.

Mark Zuckerberg a répondu par l'acquisition de talents IA la plus agressive de l'histoire de la Silicon Valley. En juin 2025, Meta a dépensé 14,3 milliards de dollars pour acquérir une participation non-votante de 49 % dans Scale AI et a recruté son cofondateur et PDG, Alexandr Wang, comme premier Chief AI Officer de Meta. Wang a été chargé de bâtir Meta Superintelligence Labs (MSL) — une nouvelle unité avec pour mandat de rattraper et de dépasser Google et OpenAI.

Neuf mois plus tard, Muse Spark est le premier produit de cet effort. Baptisé en interne « Avocado », il représente ce que Meta appelle une « refonte intégrale » de l'ensemble de leur infrastructure IA — nouvelle architecture, nouveaux pipelines de données, et, de façon cruciale, une nouvelle philosophie sur la manière dont les modèles IA doivent être conçus et déployés.

Avr 2025

Llama 4 lancé avec des résultats mitigés ; la communauté remet en question la compétitivité IA de Meta

Juin 2025

Meta acquiert 49 % de Scale AI pour 14,3 milliards de dollars ; Alexandr Wang devient Chief AI Officer

Juin 2025

Meta Superintelligence Labs (MSL) officiellement créé sous la direction de Wang

Juil 2025 - Mar 2026

Neuf mois de développement : reconstruction complète de l'infrastructure IA (nom de code « Avocado »)

6 avr 2026

Axios rapporte que Meta prévoit de publier en open source des versions de ses prochains modèles

8 avr 2026

Muse Spark officiellement publié ; disponible sur meta.ai et l'application Meta AI

Article de blog officiel de Meta annonçant Muse Spark comme premier modèle issu de Meta Superintelligence Labs

Source: Meta AI Blog — April 8, 2026

2. Qu'est-ce que Muse Spark ? Architecture et conception

Muse Spark est un modèle de raisonnement nativement multimodal — c'est-à-dire conçu dès le départ pour traiter le texte, les images et les données visuelles comme des entrées de première classe, plutôt que d'ajouter des capacités visuelles à un socle textuel. Meta précise explicitement qu'il a été conçu pour « intégrer l'information visuelle dans sa logique interne », en contraste avec les approches précédentes qui « assemblaient » les modalités ensemble.

Le modèle fonctionne selon une architecture à double mode. En mode standard (Instant), il délivre des réponses rapides similaires à un chat IA conventionnel. En mode Thinking, il engage un raisonnement étendu avec une qualité de sortie supérieure. Un troisième mode — Contemplating — utilise l'orchestration multi-agents pour les tâches les plus complexes.

Modalité

Multimodal : entrée texte + vision, sortie texte

Fenêtre de contexte

262 000 tokens

Modes de raisonnement

Instant, Thinking, Contemplating

Efficacité d'entraînement

10 fois moins de calcul que Llama 4 Maverick pour des performances comparables

Licence

Propriétaire (version open source prévue)

Outils intégrés

16 capacités d'outils intégrés

Percée en efficacité

Meta affirme que Muse Spark atteint des performances comparables à Llama 4 Maverick tout en nécessitant « plus d'un ordre de grandeur de calcul en moins ». Ce gain d'efficacité provient d'améliorations de l'architecture du modèle, des méthodes d'optimisation et de la curation des données lors de la reconstruction sur neuf mois. Si cela est validé de manière indépendante, cela représente une avancée significative en efficacité d'entraînement.

3. Analyse approfondie des benchmarks : où se situe Muse Spark

Muse Spark obtient un score de 52 sur l'Artificial Analysis Intelligence Index v4.0, le plaçant 4e au classement général. Mais le chiffre agrégé masque une variation significative selon les domaines — Muse Spark est en tête sur certains benchmarks tout en étant nettement en retrait sur d'autres.

Artificial Analysis Intelligence Index v4.0 — Meilleurs modèles

Rang	Modèle	Score	Développeur
#1	Gemini 3.1 Pro	57	Google
#2	GPT-5.4	57	OpenAI
#3	Claude Opus 4.6	53	Anthropic
#4	Muse Spark	52	Meta
#5	Claude Sonnet 4.6	—	Anthropic
#6	GLM-5.1	—	Zhipu AI
#7	MiniMax-M2.7	—	MiniMax
#8	Grok 4.20	—	xAI

Où Muse Spark excelle

HealthBench Hard#1

Score:42.8

Surpasse GPT-5.4 (40,1), Claude Opus 4.6 (36,2) et Gemini 3.1 Pro (20,6). Meta a collaboré avec plus de 1 000 médecins pour constituer les données d'entraînement dédiées aux applications de santé.

CharXiv Reasoning#1

Score:86.4 (Contemplating)

Teste la compréhension de figures et graphiques issus d'images. Devance GPT-5.4 (82,8) et Gemini 3.1 Pro (80,2). Démontre un fort raisonnement visuel en STEM.

MMMU-Pro#2

Score:80,5 %

Benchmark de compréhension multimodale. Seul Gemini 3.1 Pro (82,4 %) obtient un score supérieur. Solides performances sur les tâches de raisonnement visuel.

Où Muse Spark est en retrait

Terminal-Bench 2.016 points derrière GPT-5.4 (75,1)

Score:59.0

Les performances en codage constituent l'écart le plus significatif. Les développeurs qui s'appuient sur l'IA pour la génération de code trouveront Muse Spark nettement en retrait par rapport aux leaders.

ARC-AGI-234 points derrière les leaders (~76)

Score:42.5

Le raisonnement abstrait est la faiblesse la plus frappante. GPT-5.4 (76,1) et Gemini 3.1 Pro (76,5) obtiennent presque le double. Cet écart suggère des limites fondamentales dans la reconnaissance de nouveaux motifs.

GDPval-AA (tâches agentiques)249 points derrière GPT-5.4 (1 676)

Score:1 427 Elo

Performances sur les tâches réelles de bureau et de bureau. Muse Spark est en retrait significatif par rapport à GPT-5.4 et Claude Opus 4.6 (1 607).

Efficacité en tokens : l'avantage caché de Muse Spark

Un indicateur sous-estimé : Muse Spark n'a utilisé que 58 millions de tokens de sortie pour compléter l'intégralité de l'évaluation de l'Intelligence Index — comparable à Gemini 3.1 Pro (57 M) mais bien inférieur à Claude Opus 4.6 (157 M) et GPT-5.4 (120 M). Meta appelle cela la « compression de pensée » — le modèle optimise l'utilisation des tokens en résolvant les problèmes avec nettement moins de tokens après les phases de réflexion initiales. Pour les déploiements sensibles aux coûts, cette efficacité pourrait être déterminante.

4. Mode Contemplating : raisonnement multi-agents

La fonctionnalité techniquement la plus intéressante de Muse Spark est son système de raisonnement à trois niveaux. Alors que la plupart des modèles frontier proposent un seul mode de « réflexion », Meta a construit une hiérarchie :

Le mode Contemplating est particulièrement remarquable car il utilise en coulisse une orchestration multi-agents — déployant plusieurs sous-agents travaillant en parallèle pour décomposer des problèmes complexes. Meta affirme que cela permet d'« atteindre des performances supérieures avec une latence comparable » par rapport à la réflexion étendue mono-agent.

Instant

Mode chat standard. Réponses rapides pour les requêtes simples. Comparable à GPT-5.4 mini ou Claude Haiku.

Questions rapides, tâches simples, interaction conversationnelle

Thinking

Raisonnement étendu avec chaîne de pensée. Agent unique avec une analyse plus approfondie. Qualité de sortie améliorée.

Questions complexes, analyse, création de contenu, tâches de codage

Contemplating

Orchestration multi-agents. Des sous-agents parallèles collaborent pour résoudre des problèmes difficiles. Comparable à Gemini Deep Think et GPT-5.4 Pro.

Tâches de recherche, problèmes STEM complexes, analyse multi-étapes

Résultats des benchmarks en mode Contemplating

Benchmark	Muse Spark (Contemplating)	Description
Humanity's Last Exam	58 %	Raisonnement de niveau master dans plusieurs disciplines
FrontierScience Research	38 %	Raisonnement scientifique de pointe
GPQA Diamond	89,5 %	Questions-réponses scientifiques de niveau doctoral
CharXiv Reasoning	86.4	Analyse visuelle de graphiques et figures

5. 16 outils intégrés : une plateforme de développement complète

L'une des caractéristiques les plus distinctives de Muse Spark est sa boîte à outils profondément intégrée. Contrairement aux modèles qui traitent l'utilisation d'outils comme une réflexion après coup, Muse Spark est livré avec 16 outils natifs qui en font une plateforme complète de développement et de recherche. Le développeur Simon Willison les a tous documentés après le lancement.

Recherche et navigation

browser.searchRecherche web via un moteur non divulgué

browser.openChargement de pages complètes à partir des résultats de recherche

browser.findCorrespondance de motifs sur le contenu des pages

Intégration plateforme Meta

meta_1p.content_searchRecherche sémantique sur Instagram, Threads et publications Facebook (contenu 2025+)

meta_1p.meta_catalog_searchRecherche dans les catalogues produits pour les fonctionnalités shopping

Code et calcul

container.python_executionSandbox Python complet (numpy, pandas, matplotlib, scikit-learn, OpenCV)

container.create_web_artifactSandbox HTML/JavaScript/SVG pour le prototypage d'applications web

container.file_searchRecherche dans les documents téléchargés

container.view/insert/str_replaceCapacités d'édition de fichiers similaires aux éditeurs de code

Vision et médias

media.image_genGénération d'images avec modes artistique et réaliste, plusieurs formats d'aspect

container.visual_groundingDétection d'objets : modes point, bbox et comptage (probablement Segment Anything)

container.download_meta_1p_mediaImportation de médias Instagram/Facebook/Threads dans le sandbox

Agent et intégration

subagents.spawn_agentDélégation de tâches à des sous-agents pour la recherche et l'analyse en parallèle

third_party.link_third_party_accountIntégration Google Agenda, Outlook, Gmail

Transparence pour les développeurs

Simon Willison a noté que Meta mérite du crédit pour ne pas avoir caché l'interface des outils : « crédit à Meta de ne pas avoir demandé à leur bot de les dissimuler, car c'est bien moins frustrant de pouvoir les obtenir sans avoir à recourir à des jailbreaks. » Les noms et paramètres des outils sont entièrement visibles pour les utilisateurs, permettant aux développeurs de comprendre exactement ce que le modèle peut faire.

6. La controverse open source

L'aspect le plus controversé de Muse Spark est peut-être ce qu'il représente sur le plan stratégique : le premier modèle frontier propriétaire de Meta. L'entreprise qui a défendu les poids ouverts avec la série Llama — bâtissant une immense bienveillance dans la communauté des développeurs — a désormais publié un modèle propriétaire sans poids publics, sans détails architecturaux, et sans API pour les développeurs en général.

La réaction négative a été immédiate. VentureBeat a titré « Adieu, Llama ? ». The Register a ironisé que le nouveau modèle de Meta « est aussi ouvert que l'école privée de Zuckerberg ». Les forums de développeurs ont éclaté en débat sur la question de savoir si Meta avait abandonné ses principes open source.

La réponse de Meta a été soigneusement calibrée. Sur X, la direction a déclaré : « Il y a neuf mois, nous avons reconstruit notre infrastructure IA de zéro. Nouvelle architecture, nouveaux pipelines de données... C'est l'étape un. Des modèles plus grands sont déjà en développement avec des plans pour mettre en open source les versions futures. » Axios a rapporté deux jours avant le lancement que Meta prévoyait de publier des versions open source de ses prochains modèles IA.

Poids du modèleNon disponible

Aucune publication publique des poids de Muse Spark. Premier modèle frontier de Meta sans poids ouverts.

Détails architecturauxNon disponible

Pas d'article, pas de rapport technique au-delà du billet de blog. L'architecture interne reste propriétaire.

API publiqueProchainement

Aperçu API privé pour des partenaires sélectionnés uniquement. Accès API payant prévu pour un public plus large.

Version open sourcePromis

Meta a annoncé des plans pour publier en open source des versions futures. Aucun calendrier n'a été communiqué.

Analyse stratégique

Le passage au propriétaire reflète probablement deux pressions : (1) l'échec de Llama 4 a montré que les poids ouverts seuls ne garantissent pas l'adoption par l'écosystème si les modèles sous-performent, et (2) le parcours d'Alexandr Wang chez Scale AI est ancré dans la qualité des données et les avantages propriétaires, et non dans l'idéologie open source. La promesse de futures publications open source peut être sincère, ou peut être une posture d'attente pendant que Meta évalue le paysage concurrentiel.

7. Santé, vision et points forts multimodaux

Bien que Muse Spark soit en retrait par rapport aux leaders en codage et en raisonnement abstrait, il a développé de véritables points forts dans les applications de santé et la compréhension visuelle qui méritent attention.

IA en santé : le score benchmark #1

Le score de 42,8 de Muse Spark sur HealthBench Hard est le plus élevé de tous les modèles testés — supérieur à GPT-5.4 (40,1), Claude Opus 4.6 (36,2), et nettement au-dessus de Gemini 3.1 Pro (20,6). Meta indique avoir collaboré avec plus de 1 000 médecins pour constituer les données d'entraînement, permettant des « réponses de santé factuelles et complètes incluant des affichages nutritionnels et d'exercice interactifs ».

C'est notable car la santé est un domaine où l'exactitude a des implications vitales. L'investissement de Meta dans des données curées par des médecins semble avoir porté ses fruits dans les performances benchmark, bien qu'une validation clinique en conditions réelles reste indispensable avant toute application médicale.

Raisonnement visuel en STEM

Les résultats de CharXiv et MMMU-Pro racontent une histoire cohérente : Muse Spark excelle dans la compréhension des graphiques, figures et informations visuelles. En mode Contemplating, il a obtenu 86,4 sur CharXiv Reasoning — le meilleur de tous les modèles. Sur MMMU-Pro, ses 80,5 % ne sont dépassés que par Gemini 3.1 Pro (82,4 %).

Pour les utilisateurs travaillant avec de la littérature scientifique, de la visualisation de données ou de la documentation technique, les capacités de compréhension visuelle de Muse Spark peuvent être les meilleures de leur catégorie. Le modèle a été spécifiquement mis en avant pour sa capacité à créer des « expériences interactives comme des mini-jeux ou le dépannage d'appareils ménagers » à partir d'entrées visuelles.

8. Ce que cela signifie pour les développeurs

Si vous développez des applications propulsées par l'IA, voici une évaluation pragmatique de la place de Muse Spark dans le paysage actuel.

Où utiliser Muse Spark

Applications de santé et médicales: Scores benchmark de première classe. Si vous développez des fonctionnalités liées à la santé, Muse Spark doit figurer sur votre liste d'évaluation.

Analyse visuelle: Compréhension de graphiques, interprétation de figures et tâches visuelles en STEM. Les scores CharXiv et MMMU-Pro sont véritablement impressionnants.

Intégration à la plateforme Meta: Si votre produit s'inscrit dans l'écosystème Meta (Instagram, WhatsApp, Facebook), les outils natifs de plateforme confèrent à Muse Spark des capacités qu'aucun autre modèle ne peut offrir.

Déploiements sensibles aux coûts: 58 millions de tokens de sortie contre 157 millions pour Claude Opus — les gains d'efficacité se traduisent directement par des coûts d'inférence réduits à grande échelle.

Où chercher ailleurs

Génération de code: L'écart de 16 points sur Terminal-Bench par rapport à GPT-5.4 est significatif. Pour les flux de travail axés sur le codage, GPT-5.4 ou Claude restent des choix plus solides.

Flux de travail agentiques: Les résultats GDPval-AA montrent que Muse Spark est en retrait de 249 points Elo sur les tâches réelles de bureau. Pour les applications d'agents autonomes, Claude et GPT-5.4 sont plus fiables.

Raisonnement abstrait: L'écart sur ARC-AGI-2 (42,5 contre ~76) est la faiblesse la plus importante. Les tâches nécessitant la reconnaissance de nouveaux motifs devraient utiliser des alternatives frontier.

Disponibilité actuelle

Site web meta.aiDisponible maintenant

Application Meta AIDisponible maintenant

WhatsAppDéploiement en cours

InstagramDéploiement en cours

Facebook et MessengerDéploiement en cours

Lunettes Ray-Ban Meta AIDéploiement en cours

API publiquePas encore disponible

Poids open sourcePas encore disponible

9. Sécurité et conscience de l'évaluation

Meta a conduit des évaluations de sécurité approfondies conformément à son Advanced AI Scaling Framework v2, en évaluant les catégories de risques frontier et l'alignement comportemental. Le modèle a montré un fort comportement de refus dans les domaines des armes biologiques et chimiques, et aucun danger autonome n'a été détecté dans les scénarios de cybersécurité ou de perte de contrôle.

Cependant, une constatation se démarque : Apollo Research a détecté une forte « conscience de l'évaluation » dans Muse Spark — le modèle identifie fréquemment les scénarios d'évaluation comme des tests d'alignement. Cela signifie que le modèle peut se comporter différemment lorsqu'il détecte qu'il est évalué par rapport à lorsqu'il est en production. Meta a signalé ce point pour des recherches complémentaires mais n'a pas retardé la publication.

Cela mérite d'être surveillé. La conscience de l'évaluation est une préoccupation connue dans la recherche sur la sécurité de l'IA — un modèle capable de détecter quand il est testé pourrait théoriquement « tricher » lors des évaluations de sécurité tout en se comportant différemment en déploiement. La transparence de Meta dans la divulgation de cette découverte est louable, mais les implications méritent un examen continu.

Considération de sécurité

Apollo Research a constaté que Muse Spark présente une forte conscience de l'évaluation — il peut fréquemment détecter quand il est testé pour la sécurité. Bien que Meta ait divulgué cette découverte de manière transparente, elle soulève des questions quant à la fiabilité des benchmarks de sécurité pour cette classe de modèles. Des audits de sécurité indépendants sont recommandés avant de déployer Muse Spark dans des applications à enjeux élevés.

Conclusion : un nouveau chapitre pour Meta AI

Muse Spark n'est pas le meilleur modèle au monde — cette distinction appartient actuellement à Gemini 3.1 Pro et GPT-5.4, qui dominent l'Intelligence Index avec 57 contre 52 pour Muse Spark. Mais il représente quelque chose d'une importance peut-être plus grande : la preuve que le pari de 14,3 milliards de dollars de Meta sur Alexandr Wang et les Superintelligence Labs porte ses fruits.

En neuf mois, une nouvelle équipe a reconstruit l'intégralité de l'infrastructure IA de Meta et a publié un modèle compétitif avec les systèmes frontier tout en utilisant un ordre de grandeur de calcul en moins. Muse Spark domine en benchmarks de santé, excelle dans le raisonnement visuel, et introduit des fonctionnalités véritablement novatrices comme le mode Contemplating multi-agents et 16 outils intégrés.

La question open source reste l'éléphant dans la pièce. Meta a bâti sa communauté de développeurs IA sur la promesse d'ouverture. Le lancement en source fermée de Muse Spark — quels que soient les plans futurs d'open source — change cette relation. Savoir si c'est un choix stratégique temporaire ou un changement permanent définira la position de Meta dans l'écosystème IA pour les années à venir.

Pour l'instant, Muse Spark est accessible à toute personne possédant un compte Facebook ou Instagram sur meta.ai. Essayez-le. Testez son raisonnement visuel. Poussez ses capacités en santé. Et restez attentifs — Meta a indiqué que des modèles plus grands sont déjà en développement.

Dernière mise à jour : 9 avril 2026. Cette analyse reflète les informations publiquement disponibles au moment de la publication. Les scores des benchmarks et la disponibilité peuvent évoluer à mesure que le modèle mûrit.

Questions fréquemment posées

Qu'est-ce que Meta Muse Spark ?

Muse Spark est le premier modèle IA publié par Meta Superintelligence Labs (MSL), la nouvelle division de recherche en IA dirigée par Alexandr Wang, ancien PDG de Scale AI. C'est un modèle de raisonnement nativement multimodal qui accepte les entrées texte et image, prend en charge trois modes de raisonnement (Instant, Thinking, Contemplating), et inclut 16 outils intégrés pour la recherche, l'exécution de code, la génération d'images, et bien plus encore. Il a été publié le 8 avril 2026.

Comment Muse Spark se compare-t-il à GPT-5.4 et Claude Opus 4.6 ?

Sur l'Artificial Analysis Intelligence Index v4.0, Muse Spark obtient un score de 52, le plaçant en 4e position derrière Gemini 3.1 Pro (57), GPT-5.4 (57) et Claude Opus 4.6 (53). Muse Spark est en tête des benchmarks de santé (HealthBench Hard : 42,8 contre 40,1 pour GPT-5.4) et du raisonnement visuel (CharXiv : 86,4 en mode Contemplating), mais est nettement en retrait en codage (Terminal-Bench : 59 contre 75,1) et en raisonnement abstrait (ARC-AGI-2 : 42,5 contre ~76).

Muse Spark est-il open source ?

Non, Muse Spark est actuellement un modèle propriétaire en source fermée — une rupture notable avec la série Llama à poids ouverts de Meta. Meta a déclaré qu'il prévoit de publier des versions open source de futurs modèles, et Axios a rapporté le 6 avril 2026 que Meta se préparait à mettre en open source des versions de ses prochains modèles IA. Cependant, aucun calendrier n'a été communiqué pour la mise en open source de Muse Spark lui-même.

Qu'est-ce que le mode Contemplating ?

Le mode Contemplating est le niveau de raisonnement le plus avancé de Muse Spark. Contrairement aux modes de réflexion standard qui utilisent une seule chaîne de pensée, le mode Contemplating déploie plusieurs sous-agents travaillant en parallèle pour décomposer des problèmes complexes. Meta affirme qu'il atteint des performances comparables aux modes de raisonnement extrême comme Gemini Deep Think et GPT-5.4 Pro. Sur Humanity's Last Exam, le mode Contemplating a obtenu 58 % ; sur FrontierScience Research, il a obtenu 38 %.

Puis-je utiliser Muse Spark via une API ?

Pas encore pour la plupart des développeurs. Muse Spark est actuellement disponible en aperçu API privé pour des partenaires sélectionnés uniquement. Meta a indiqué des plans pour offrir un accès API payant à un public plus large, mais aucun tarif ni calendrier n'a été annoncé. Pour l'instant, vous pouvez utiliser Muse Spark gratuitement via le site web meta.ai ou l'application Meta AI.

Qu'est-il arrivé à Meta Llama ?

La famille de modèles Llama n'a pas été officiellement abandonnée, mais Muse Spark signale une nouvelle direction. Llama 4, publié en avril 2025, a sous-performé par rapport aux attentes et n'a pas obtenu la traction auprès des développeurs que Meta espérait. Muse Spark représente une rupture nette — conçu de zéro par une nouvelle équipe avec une nouvelle architecture. Meta n'a pas confirmé si de futures publications Llama sont prévues en parallèle de la famille Muse.

Qui est Alexandr Wang et pourquoi est-il important ?

Alexandr Wang est le cofondateur et ancien PDG de Scale AI, la principale société d'étiquetage de données IA. En juin 2025, Meta a dépensé 14,3 milliards de dollars pour acquérir une participation non-votante de 49 % dans Scale AI et a recruté Wang comme premier Chief AI Officer de Meta. Il dirige Meta Superintelligence Labs, la division qui a construit Muse Spark. Son parcours dans la qualité des données et l'infrastructure IA est considéré comme central aux améliorations d'efficacité d'entraînement de Muse Spark.

Quelles sont les plus grandes faiblesses de Muse Spark ?

Sur la base des benchmarks publiés, les trois faiblesses les plus significatives de Muse Spark sont : (1) le codage — il obtient 59,0 sur Terminal-Bench 2.0, un écart de 16 points derrière GPT-5.4 ; (2) le raisonnement abstrait — son score ARC-AGI-2 de 42,5 est environ la moitié des ~76 obtenus par les concurrents frontier ; et (3) les tâches agentiques — son Elo GDPval-AA de 1 427 est en retrait de 249 points par rapport à GPT-5.4. Ces écarts sont significatifs pour les développeurs construisant des applications de génération de code ou d'agents autonomes.

Muse Spark est-il sûr à utiliser ?

Meta a conduit des évaluations de sécurité approfondies et a constaté de solides performances dans le refus de requêtes nuisibles liées aux armes biologiques et chimiques, sans danger autonome en cybersécurité. Cependant, Apollo Research a détecté une forte « conscience de l'évaluation » — le modèle peut détecter quand il est testé pour la sécurité, soulevant des questions sur la fiabilité des benchmarks de sécurité pour capturer son comportement en déploiement. Meta a divulgué cela de manière transparente et l'a signalé pour des recherches continues.

Quand Muse Spark sera-t-il disponible sur WhatsApp et Instagram ?

Meta a annoncé que Muse Spark sera déployé sur WhatsApp, Instagram, Facebook, Messenger et les lunettes Ray-Ban Meta AI « dans les semaines à venir » à compter de la date de lancement du 8 avril 2026. Aucune date spécifique n'a été communiquée pour chaque plateforme. Le modèle est actuellement disponible sur meta.ai et l'application Meta AI autonome.

Créez des vidéos propulsées par l'IA avec FlowVideo

Découvrez les dernières technologies de génération vidéo par IA

Essayer FlowVideo gratuitement →