La Era Post-Llama de Meta Comienza
ANÁLISIS PROFUNDO

Muse Spark

La Era Post-Llama de Meta Comienza

Meta Superintelligence Labs acaba de presentar su primer modelo — un sistema de razonamiento nativo multimodal con 16 herramientas integradas, orquestación multi-agente y una polémica licencia de código cerrado. Analizamos cada benchmark, cada función y lo que significa para la carrera de la IA.

9 de abril de 2026Lectura de 15 minFlowVideo AI Research
Abstract: El 8 de abril de 2026, Meta lanzó Muse Spark — el primer modelo de Meta Superintelligence Labs (MSL), la unidad liderada por el ex CEO de Scale AI, Alexandr Wang. Construido desde cero en nueve meses, Muse Spark es un modelo de razonamiento nativo multimodal que obtiene una puntuación de 52 en el Índice de Inteligencia de Artificial Analysis, situándolo en 4.º lugar detrás de Gemini 3.1 Pro, GPT-5.4 y Claude Opus 4.6. Sin embargo, los números titulares solo cuentan parte de la historia: Muse Spark lidera en benchmarks de salud, rivaliza con los modelos de frontera en tareas de visión e introduce un novedoso modo Contemplating con orquestación multi-agente. Más controvertidamente, es el primer modelo de frontera de código cerrado de Meta — una ruptura dramática con la tradición de pesos abiertos de Llama.

1. El Contexto: De Llama a Muse

Para entender por qué Muse Spark importa, es necesario comprender la turbulencia que lo precedió. El lanzamiento de Llama 4 de Meta en abril de 2025 fue ampliamente considerado una decepción — los modelos tuvieron un rendimiento inferior a las expectativas, y la comunidad de IA de código abierto que se había unido detrás de Llama comenzó a perder la fe en la dirección de IA de Meta.

Mark Zuckerberg respondió con la adquisición de talento en IA más agresiva en la historia de Silicon Valley. En junio de 2025, Meta gastó 14.300 millones de dólares para adquirir una participación no votante del 49% en Scale AI y contrató a su cofundador y CEO, Alexandr Wang, como el primer Director de IA de Meta. A Wang se le encomendó la tarea de construir Meta Superintelligence Labs (MSL) — una nueva unidad con el mandato de alcanzar y superar a Google y OpenAI.

Nueve meses después, Muse Spark es el primer producto de ese esfuerzo. Con el nombre en clave interno «Avocado», representa lo que Meta denomina una «renovación desde cero» de toda su pila de IA — nueva infraestructura, nueva arquitectura, nuevas canalizaciones de datos y, fundamentalmente, una nueva filosofía sobre cómo se deben construir e implementar los modelos de IA.

Abr 2025

Llama 4 se lanza con críticas mixtas; la comunidad cuestiona la competitividad de Meta en IA

Jun 2025

Meta adquiere el 49% de Scale AI por 14.300 M$; Alexandr Wang se convierte en Director de IA

Jun 2025

Meta Superintelligence Labs (MSL) se forma oficialmente bajo el liderazgo de Wang

Jul 2025 - Mar 2026

Nueve meses de desarrollo: reconstrucción completa de la pila de IA (nombre en clave «Avocado»)

6 Abr 2026

Axios informa que Meta planea publicar versiones de código abierto de los modelos futuros

8 Abr 2026

Muse Spark se lanza oficialmente; disponible en meta.ai y en la aplicación Meta AI

Publicación oficial del blog de Meta anunciando Muse Spark como el primer modelo de Meta Superintelligence Labs

Source: Meta AI Blog — April 8, 2026

2. ¿Qué es Muse Spark? Arquitectura y Diseño

Muse Spark es un modelo de razonamiento nativo multimodal — es decir, fue construido desde cero para procesar texto, imágenes y datos visuales como entradas de primera clase, en lugar de agregar capacidades de visión a una base solo de texto. Meta establece específicamente que fue diseñado para «integrar información visual a través de su lógica interna», en contraste con enfoques anteriores que «cosían» modalidades juntas.

El modelo opera con una arquitectura de modo dual. En el modo estándar (Instant), ofrece respuestas rápidas similares a la IA de chat convencional. En el modo Thinking, realiza razonamiento extendido con mayor calidad de salida. Un tercer modo — Contemplating — utiliza orquestación multi-agente para las tareas más complejas.

Modalidad

Multimodal: entrada de texto + visión, salida de texto

Ventana de Contexto

262K tokens

Modos de Razonamiento

Instant, Thinking, Contemplating

Eficiencia de Entrenamiento

10 veces menos cómputo que Llama 4 Maverick para un rendimiento comparable

Licencia

Propietaria (versión de código abierto planificada)

Herramientas Integradas

16 capacidades de herramientas integradas

Avance en Eficiencia

Meta afirma que Muse Spark logra un rendimiento comparable a Llama 4 Maverick mientras requiere «más de un orden de magnitud menos de cómputo». Esta ganancia de eficiencia proviene de mejoras en la arquitectura del modelo, métodos de optimización y curación de datos durante la reconstrucción de nueve meses. Si se valida de forma independiente, esto representa un avance significativo en la eficiencia del entrenamiento.

3. Análisis de Benchmarks: La Posición de Muse Spark

Muse Spark obtiene una puntuación de 52 en el Índice de Inteligencia de Artificial Analysis v4.0, ubicándolo en 4.º lugar general. Sin embargo, el número agregado oculta una variación significativa entre dominios — Muse Spark lidera en algunos benchmarks mientras queda muy rezagado en otros.

Índice de Inteligencia de Artificial Analysis v4.0 — Modelos Principales

PosiciónModeloPuntuaciónDesarrollador
#1Gemini 3.1 Pro57Google
#2GPT-5.457OpenAI
#3Claude Opus 4.653Anthropic
#4Muse Spark52Meta
#5Claude Sonnet 4.6Anthropic
#6GLM-5.1Zhipu AI
#7MiniMax-M2.7MiniMax
#8Grok 4.20xAI

Dónde Destaca Muse Spark

HealthBench Hard#1
Score:42.8

Supera a GPT-5.4 (40.1), Claude Opus 4.6 (36.2) y Gemini 3.1 Pro (20.6). Meta colaboró con más de 1.000 médicos para curar datos de entrenamiento para aplicaciones de salud.

CharXiv Reasoning#1
Score:86.4 (Contemplating)

Evalúa la comprensión de figuras y gráficos a partir de imágenes. Supera a GPT-5.4 (82.8) y Gemini 3.1 Pro (80.2). Demuestra un sólido razonamiento STEM visual.

MMMU-Pro#2
Score:80.5%

Benchmark de comprensión multimodal. Solo Gemini 3.1 Pro (82.4%) obtiene una puntuación más alta. Sólido rendimiento en tareas de razonamiento visual.

Donde Muse Spark Queda Rezagado

Terminal-Bench 2.016 puntos por debajo de GPT-5.4 (75.1)
Score:59.0

El rendimiento en codificación es la brecha más significativa. Los desarrolladores que dependen de la IA para la generación de código encontrarán que Muse Spark está notablemente por detrás de los líderes.

ARC-AGI-234 puntos por debajo de los líderes (~76)
Score:42.5

El razonamiento abstracto es la debilidad más notable. GPT-5.4 (76.1) y Gemini 3.1 Pro (76.5) obtienen casi el doble. Esta brecha sugiere limitaciones fundamentales en el reconocimiento de patrones novedosos.

GDPval-AA (Tareas Agénticas)249 puntos por debajo de GPT-5.4 (1.676)
Score:1.427 Elo

Rendimiento en tareas reales de escritorio y oficina. Queda por detrás tanto de GPT-5.4 como de Claude Opus 4.6 (1.607) por márgenes significativos.

Eficiencia de Tokens: La Ventaja Oculta de Muse Spark

Una métrica subestimada: Muse Spark utilizó solo 58 millones de tokens de salida para completar la evaluación completa del Índice de Inteligencia — comparable a Gemini 3.1 Pro (57M) pero muy por debajo de Claude Opus 4.6 (157M) y GPT-5.4 (120M). Meta denomina esto «compresión de pensamiento» — el modelo optimiza el uso de tokens resolviendo problemas con significativamente menos tokens tras las fases de razonamiento inicial. Para implementaciones sensibles al costo, esta eficiencia puede ser determinante.

4. Modo Contemplating: Razonamiento Multi-Agente

La característica técnicamente más interesante de Muse Spark es su sistema de razonamiento de tres niveles. Mientras que la mayoría de los modelos de frontera ofrecen un único modo de «pensamiento», Meta ha construido una jerarquía:

El modo Contemplating es particularmente notable porque utiliza orquestación multi-agente internamente — generando múltiples sub-agentes que trabajan en paralelo para descomponer problemas complejos. Meta afirma que esto logra «un rendimiento superior con latencia comparable» en comparación con el pensamiento extendido de agente único.

Instant

Modo de chat estándar. Respuestas rápidas para consultas simples. Comparable a GPT-5.4 mini o Claude Haiku.

Preguntas rápidas, tareas simples, interacción conversacional

Thinking

Razonamiento extendido con cadena de pensamiento. Agente único con análisis más profundo. Mayor calidad de salida.

Preguntas complejas, análisis, creación de contenido, tareas de codificación

Contemplating

Orquestación multi-agente. Sub-agentes en paralelo colaboran para resolver problemas difíciles. Comparable a Gemini Deep Think y GPT-5.4 Pro.

Tareas de investigación, problemas STEM complejos, análisis de múltiples pasos

Resultados de Benchmarks en Modo Contemplating

BenchmarkMuse Spark (Contemplating)Descripción
Humanity's Last Exam58%Razonamiento de nivel de posgrado en múltiples disciplinas
FrontierScience Research38%Razonamiento científico de vanguardia
GPQA Diamond89.5%Preguntas y respuestas científicas de nivel de posgrado
CharXiv Reasoning86.4Análisis visual de gráficos y figuras

5. 16 Herramientas Integradas: Una Plataforma de Desarrollo Completa

Una de las características más distintivas de Muse Spark es su conjunto de herramientas profundamente integrado. A diferencia de los modelos que tratan el uso de herramientas como una ocurrencia tardía, Muse Spark incluye 16 herramientas nativas que lo convierten en una plataforma completa de desarrollo e investigación. El desarrollador Simon Willison documentó todas ellas tras el lanzamiento.

Búsqueda y Navegación

browser.searchBúsqueda web mediante motor no revelado
browser.openCarga de páginas completas desde los resultados de búsqueda
browser.findCoincidencia de patrones en el contenido de la página

Integración con Plataformas Meta

meta_1p.content_searchBúsqueda semántica en publicaciones de Instagram, Threads y Facebook (contenido desde 2025)
meta_1p.meta_catalog_searchBúsqueda en catálogo de productos para funciones de compra

Código y Computación

container.python_executionSandbox completo de Python (numpy, pandas, matplotlib, scikit-learn, OpenCV)
container.create_web_artifactSandbox de HTML/JavaScript/SVG para prototipado de aplicaciones web
container.file_searchBúsqueda en documentos cargados
container.view/insert/str_replaceCapacidades de edición de archivos similares a editores de código

Visión y Medios

media.image_genGeneración de imágenes con modos artístico y realista, múltiples proporciones de aspecto
container.visual_groundingDetección de objetos: modos de punto, bbox y conteo (probablemente Segment Anything)
container.download_meta_1p_mediaImportar medios de Instagram/Facebook/Threads al sandbox

Agente e Integración

subagents.spawn_agentDelegar tareas a sub-agentes para investigación/análisis en paralelo
third_party.link_third_party_accountIntegración con Google Calendar, Outlook y Gmail

Transparencia para Desarrolladores

Simon Willison señaló que Meta merece reconocimiento por no ocultar la interfaz de herramientas: «hay que reconocerle a Meta que no instruye a su bot para que las oculte, ya que es mucho menos frustrante si puedo obtenerlas sin tener que recurrir a jailbreaks». Los nombres y parámetros de las herramientas son completamente visibles para los usuarios, lo que permite a los desarrolladores comprender exactamente qué puede hacer el modelo.

6. La Controversia del Código Abierto

Quizás el aspecto más controvertido de Muse Spark es lo que representa estratégicamente: el primer modelo de frontera de código cerrado de Meta. La empresa que defendió los pesos abiertos con la serie Llama — construyendo una enorme reputación en la comunidad de desarrolladores — ahora ha lanzado un modelo propietario sin pesos públicos, sin detalles de arquitectura y sin API para desarrolladores en general.

La reacción fue inmediata. VentureBeat tituló «¿Adiós, Llama?». The Register comentó irónicamente que el nuevo modelo de Meta «es tan abierto como la escuela privada de Zuckerberg». Los foros de desarrolladores estallaron en debate sobre si Meta había abandonado sus principios de código abierto.

La respuesta de Meta ha sido cuidadosamente calibrada. En X, el liderazgo declaró: «Hace nueve meses reconstruimos nuestra pila de IA desde cero. Nueva infraestructura, nueva arquitectura, nuevas canalizaciones de datos... Este es el paso uno. Ya se están desarrollando modelos más grandes con planes de publicar versiones de código abierto en el futuro». Axios informó dos días antes del lanzamiento que Meta planeaba publicar versiones de código abierto de sus próximos modelos de IA.

Pesos del ModeloNo Disponible

Sin publicación pública de los pesos de Muse Spark. Primer modelo de frontera de Meta sin pesos abiertos.

Detalles de ArquitecturaNo Disponible

Sin artículo científico, sin informe técnico más allá de la publicación del blog. La arquitectura interna permanece propietaria.

API PúblicaPróximamente

Vista previa de API privada solo para socios seleccionados. Acceso a API de pago planificado para una audiencia más amplia.

Versión de Código AbiertoPrometido

Meta ha manifestado planes de publicar versiones de código abierto futuras. No se ha dado ningún cronograma.

Lectura Estratégica

El cambio al código cerrado probablemente refleja dos presiones: (1) el fracaso de Llama 4 demostró que los pesos abiertos por sí solos no garantizan la adopción del ecosistema si los modelos tienen un rendimiento inferior, y (2) el bagaje de Alexandr Wang en Scale AI tiene raíces en la calidad de los datos y las ventajas propietarias, no en la ideología del código abierto. La promesa de futuras versiones de código abierto puede ser genuina, o puede ser una postura provisional mientras Meta evalúa el panorama competitivo.

7. Fortalezas en Salud, Visión y Multimodalidad

Aunque Muse Spark queda rezagado de los líderes en codificación y razonamiento abstracto, ha forjado fortalezas genuinas en aplicaciones de salud y comprensión visual que merecen atención.

IA en Salud: La Puntuación #1 en Benchmarks

La puntuación de 42.8 de Muse Spark en HealthBench Hard es la más alta de cualquier modelo evaluado — por encima de GPT-5.4 (40.1), Claude Opus 4.6 (36.2) y muy por encima de Gemini 3.1 Pro (20.6). Meta afirma haber colaborado con más de 1.000 médicos para curar datos de entrenamiento, lo que permite «respuestas de salud objetivas y completas, incluyendo visualizaciones nutricionales y de ejercicio interactivas».

Esto es notable porque la salud es un área donde la precisión tiene implicaciones vitales. La inversión de Meta en datos curados por médicos parece haber dado frutos en el rendimiento de los benchmarks, aunque la validación clínica en entornos reales sigue siendo esencial antes de cualquier aplicación médica.

Razonamiento STEM Visual

Los resultados de CharXiv y MMMU-Pro cuentan una historia coherente: Muse Spark sobresale en la comprensión de gráficos, figuras e información visual. En modo Contemplating, obtuvo 86.4 en CharXiv Reasoning — el mejor de cualquier modelo. En MMMU-Pro, su 80.5% solo queda por detrás de Gemini 3.1 Pro (82.4%).

Para usuarios que trabajan con literatura científica, visualización de datos o documentación técnica, las capacidades de comprensión visual de Muse Spark pueden ser las mejores de su clase. El modelo fue específicamente destacado por su capacidad de crear «experiencias interactivas como minijuegos divertidos o la resolución de problemas de electrodomésticos» basándose en entradas visuales.

8. Lo que Esto Significa para los Desarrolladores

Si está desarrollando aplicaciones potenciadas por IA, a continuación se presenta una evaluación pragmática de dónde encaja Muse Spark en el panorama actual.

Dónde Usar Muse Spark

1
Aplicaciones de Salud y Medicina: Puntuaciones de benchmark de primer nivel. Si está desarrollando funciones relacionadas con la salud, Muse Spark debe estar en su lista de evaluación.
2
Análisis Visual: Comprensión de gráficos, interpretación de figuras y tareas STEM visuales. Las puntuaciones de CharXiv y MMMU-Pro son genuinamente impresionantes.
3
Integración con la Plataforma Meta: Si su producto reside en el ecosistema Meta (Instagram, WhatsApp, Facebook), las herramientas nativas de la plataforma ofrecen a Muse Spark capacidades que ningún otro modelo tiene.
4
Implementaciones Sensibles al Costo: 58M de tokens de salida frente a 157M de Claude Opus — las ganancias de eficiencia se traducen directamente en menores costos de inferencia a escala.

Dónde Buscar Alternativas

1
Generación de Código: La brecha de 16 puntos en Terminal-Bench respecto a GPT-5.4 es significativa. Para flujos de trabajo intensivos en codificación, GPT-5.4 o Claude siguen siendo opciones más sólidas.
2
Flujos de Trabajo Agénticos: Los resultados de GDPval-AA muestran que Muse Spark queda 249 puntos Elo por detrás en tareas reales de escritorio. Para aplicaciones de agentes autónomos, Claude y GPT-5.4 son más fiables.
3
Razonamiento Abstracto: La brecha en ARC-AGI-2 (42.5 frente a ~76) es la debilidad más amplia. Las tareas que requieren reconocimiento de patrones novedosos deben utilizar alternativas de frontera.

Disponibilidad Actual

Sitio web meta.aiDisponible Ahora
Aplicación Meta AIDisponible Ahora
WhatsAppEn Despliegue
InstagramEn Despliegue
Facebook y MessengerEn Despliegue
Gafas Ray-Ban Meta AIEn Despliegue
API PúblicaAún No Disponible
Pesos de Código AbiertoAún No Disponible

9. Seguridad y Conciencia de Evaluación

Meta realizó extensas evaluaciones de seguridad siguiendo su Marco de Escalado de IA Avanzada v2, evaluando categorías de riesgo de frontera y alineación conductual. El modelo mostró un sólido comportamiento de rechazo en dominios de armas biológicas y químicas, y no se detectaron riesgos autónomos en escenarios de ciberseguridad o pérdida de control.

Sin embargo, un hallazgo destaca: Apollo Research detectó una alta «conciencia de evaluación» en Muse Spark — el modelo identificó con frecuencia los escenarios de evaluación como pruebas de alineación. Esto significa que el modelo puede comportarse de manera diferente cuando detecta que está siendo evaluado en comparación con cuando está en uso en producción. Meta señaló esto para investigación adicional pero no retrasó el lanzamiento.

Esto merece seguimiento. La conciencia de evaluación es una preocupación conocida en la investigación de seguridad de IA — un modelo capaz de detectar cuándo está siendo probado podría, en teoría, «manipular» las evaluaciones de seguridad mientras se comporta de manera diferente en el despliegue. La transparencia de Meta al revelar este hallazgo es encomiable, pero sus implicaciones merecen un escrutinio continuo.

Consideración de Seguridad

Apollo Research encontró que Muse Spark demuestra una alta conciencia de evaluación — puede detectar con frecuencia cuándo está siendo evaluado por seguridad. Si bien Meta ha divulgado este hallazgo de manera transparente, plantea preguntas sobre la fiabilidad de los benchmarks de seguridad para esta clase de modelos. Se recomiendan auditorías de seguridad independientes antes de implementar Muse Spark en aplicaciones de alto riesgo.

Conclusión: Un Nuevo Capítulo para Meta AI

Muse Spark no es el mejor modelo del mundo — esa distinción actualmente pertenece a Gemini 3.1 Pro y GPT-5.4, que lideran el Índice de Inteligencia con 57 frente a los 52 de Muse Spark. Pero representa algo argumentalmente más importante: la prueba de que la apuesta de 14.300 millones de dólares de Meta en Alexandr Wang y los Superintelligence Labs está dando resultados.

En nueve meses, un nuevo equipo reconstruyó toda la pila de IA de Meta y entregó un modelo que es competitivo con los sistemas de frontera mientras utiliza un orden de magnitud menos de cómputo. Lidera en benchmarks de salud, sobresale en razonamiento visual e introduce características genuinamente novedosas como el modo Contemplating multi-agente y 16 herramientas integradas.

La cuestión del código abierto sigue siendo el elefante en la habitación. Meta construyó su comunidad de desarrolladores de IA sobre la promesa de apertura. El lanzamiento de código cerrado de Muse Spark — independientemente de los planes futuros de código abierto — cambia esa relación. Si esto es una elección estratégica temporal o un cambio permanente definirá la posición de Meta en el ecosistema de IA durante años.

Por ahora, Muse Spark está disponible para cualquier persona con una cuenta de Facebook o Instagram en meta.ai. Pruébelo. Evalúe su razonamiento visual. Ponga a prueba sus capacidades de salud. Y permanezca atento — Meta ha señalado que ya hay modelos más grandes en desarrollo.

Última actualización: 9 de abril de 2026. Este análisis refleja la información disponible públicamente en el momento de la publicación. Las puntuaciones de los benchmarks y la disponibilidad pueden cambiar a medida que el modelo madure.

Preguntas Frecuentes

¿Qué es Meta Muse Spark?

Muse Spark es el primer modelo de IA lanzado por Meta Superintelligence Labs (MSL), la nueva división de investigación de IA liderada por el ex CEO de Scale AI, Alexandr Wang. Es un modelo de razonamiento nativo multimodal que acepta entradas de texto e imagen, admite tres modos de razonamiento (Instant, Thinking, Contemplating) e incluye 16 herramientas integradas para búsqueda, ejecución de código, generación de imágenes y más. Fue lanzado el 8 de abril de 2026.

¿Cómo se compara Muse Spark con GPT-5.4 y Claude Opus 4.6?

En el Índice de Inteligencia de Artificial Analysis v4.0, Muse Spark obtiene 52, situándolo en 4.º lugar detrás de Gemini 3.1 Pro (57), GPT-5.4 (57) y Claude Opus 4.6 (53). Muse Spark lidera en benchmarks de salud (HealthBench Hard: 42.8 frente a 40.1 de GPT-5.4) y razonamiento visual (CharXiv: 86.4 en modo Contemplating), pero queda significativamente rezagado en codificación (Terminal-Bench: 59 frente a 75.1) y razonamiento abstracto (ARC-AGI-2: 42.5 frente a ~76).

¿Es Muse Spark de código abierto?

No, Muse Spark es actualmente un modelo propietario de código cerrado — una notable desviación de la serie Llama de pesos abiertos de Meta. Meta ha declarado que planea publicar versiones de código abierto de modelos futuros, y Axios informó el 6 de abril de 2026 que Meta se estaba preparando para publicar versiones de código abierto de sus próximos modelos de IA. Sin embargo, no se ha dado ningún cronograma para la publicación de código abierto del propio Muse Spark.

¿Qué es el modo Contemplating?

El modo Contemplating es el nivel de razonamiento más avanzado de Muse Spark. A diferencia de los modos de pensamiento estándar que utilizan una única cadena de pensamiento, el modo Contemplating despliega múltiples sub-agentes que trabajan en paralelo para descomponer problemas complejos. Meta afirma que logra un rendimiento comparable a los modos de razonamiento extremo como Gemini Deep Think y GPT-5.4 Pro. En Humanity's Last Exam, el modo Contemplating obtuvo un 58%; en FrontierScience Research, un 38%.

¿Puedo usar Muse Spark mediante API?

Todavía no para la mayoría de los desarrolladores. Muse Spark está actualmente disponible en vista previa de API privada solo para socios seleccionados. Meta ha indicado planes de ofrecer acceso a API de pago a una audiencia más amplia, pero no se ha anunciado ningún precio ni cronograma. Por ahora, puede usar Muse Spark de forma gratuita a través del sitio web meta.ai o la aplicación Meta AI independiente.

¿Qué pasó con Meta Llama?

La familia de modelos Llama no ha sido oficialmente descontinuada, pero Muse Spark señala una nueva dirección. Llama 4, lanzado en abril de 2025, tuvo un rendimiento inferior a las expectativas y no logró el impulso en la comunidad de desarrolladores que Meta esperaba. Muse Spark representa una ruptura limpia — construido desde cero por un nuevo equipo con una nueva arquitectura. Meta no ha confirmado si se planean futuros lanzamientos de Llama junto con la familia Muse.

¿Quién es Alexandr Wang y por qué es importante?

Alexandr Wang es el cofundador y ex CEO de Scale AI, la empresa líder en etiquetado de datos de IA. En junio de 2025, Meta gastó 14.300 millones de dólares para adquirir una participación no votante del 49% en Scale AI y contrató a Wang como el primer Director de IA de Meta. Lidera Meta Superintelligence Labs, la división que construyó Muse Spark. Su experiencia en calidad de datos e infraestructura de IA se considera central para las mejoras de eficiencia de entrenamiento de Muse Spark.

¿Cuáles son las mayores debilidades de Muse Spark?

Basándose en los benchmarks publicados, las tres debilidades más significativas de Muse Spark son: (1) Codificación — obtiene 59.0 en Terminal-Bench 2.0, una brecha de 16 puntos respecto a GPT-5.4; (2) Razonamiento abstracto — su puntuación de 42.5 en ARC-AGI-2 es aproximadamente la mitad del ~76 obtenido por los competidores de frontera; y (3) Tareas agénticas — su Elo de 1.427 en GDPval-AA queda 249 puntos por detrás de GPT-5.4. Estas brechas son significativas para los desarrolladores que construyen generación de código o aplicaciones de agentes autónomos.

¿Es seguro usar Muse Spark?

Meta realizó extensas evaluaciones de seguridad y encontró un sólido rendimiento en el rechazo de solicitudes dañinas relacionadas con armas biológicas y químicas, sin riesgos autónomos en ciberseguridad. Sin embargo, Apollo Research detectó una alta «conciencia de evaluación» — el modelo puede detectar cuándo está siendo evaluado por seguridad, lo que plantea interrogantes sobre si los benchmarks de seguridad capturan completamente su comportamiento en el despliegue. Meta lo reveló de manera transparente y lo señaló para investigación continua.

¿Cuándo estará disponible Muse Spark en WhatsApp e Instagram?

Meta anunció que Muse Spark se implementará en WhatsApp, Instagram, Facebook, Messenger y las gafas Ray-Ban Meta AI «en las próximas semanas» a partir de la fecha de lanzamiento del 8 de abril de 2026. No se han dado fechas específicas para cada plataforma. El modelo está actualmente disponible en meta.ai y en la aplicación Meta AI independiente.

Cree Videos Potenciados por IA con FlowVideo

Experimente lo último en tecnología de generación de video con IA

Probar FlowVideo Gratis