Claude Fable 5: qué cambia de verdad y cuándo te compensa usarlo

Anthropic acaba de poner sobre la mesa el primer modelo de su clase Mythos abierto al público. No es un «Opus 4.9»: es un escalón de categoría por encima, con la letra pequeña más interesante en mucho tiempo. Y, sobre todo, llega con una forma de gestionar el riesgo que probablemente marque tendencia.

Vamos al grano: qué es exactamente, qué mejora, cómo funcionan sus salvaguardas, cuánto cuesta y, la pregunta del millón, cuándo te merece la pena frente a Opus 4.8.

Qué es Claude Fable 5: la clase Mythos baja al público

Por encima de la gama Opus, Anthropic abrió hace poco una categoría nueva: los modelos clase Mythos, los más capaces que han construido. El primero fue Claude Mythos Preview, en abril, pero nunca llegó al gran público: se quedó en un grupo reducido de defensores de ciberseguridad e infraestructura crítica dentro de Project Glasswing. ¿El motivo? Es tan bueno encontrando y explotando vulnerabilidades que soltarlo sin más se consideró un riesgo serio.

Fable 5 es la solución a ese dilema: la misma potencia Mythos, pero con salvaguardas que la hacen apta para uso general. Es el modelo más capaz que Anthropic ha puesto nunca a disposición de cualquiera.

Y aquí va el matiz clave: Fable 5 y Mythos 5 son, por dentro, el mismo modelo. Lo único que los diferencia son las salvaguardas. Mythos 5 sigue restringido a los socios de Glasswing y, próximamente, a investigadores de biología seleccionados. El propio nombre lo resume: Fable, del latín fabula («aquello que se cuenta»), es primo del griego mythos. Misma criatura, distinto candado.

Qué mejora, y con qué datos

La regla que repite Anthropic es la que más te interesa: su ventaja crece cuanto más larga y compleja es la tarea. Para una consulta corta, la diferencia es marginal. Para trabajo agéntico de muchos pasos, se dispara.

Código y tareas de largo recorrido

El dato titular: Stripe lo probó sobre una base de código Ruby de 50 millones de líneas y le encargó una migración a nivel de todo el repositorio. Lo que a un equipo le habría llevado más de dos meses a mano, Fable 5 lo resolvió en un día.

Tan relevante como eso: es más eficiente en tokens. En FrontierCode, la evaluación de código de producción de Cognition, puntúa más alto que cualquier modelo de frontera incluso a esfuerzo medio. Traducción para tu factura: no necesitas ponerlo al máximo de razonamiento (ni pagar ese sobrecoste) para que rinda en código.

Análisis y knowledge work

En tareas analíticas exigentes va sobrado. Saca la mejor nota de todos los modelos en el benchmark de finanzas de Hebbia, pensado para razonamiento sénior, con saltos claros en interpretación de documentos, tablas y gráficos. Si tu trabajo es revisar informes, due diligence o cuadros de números, ahí es donde más se nota.

Visión y memoria

Es el nuevo referente en visión: extrae cifras exactas de gráficas científicas y reconstruye el código de una web partiendo solo de capturas de pantalla. Necesita además mucho menos andamiaje —se pasó un Pokémon guiándose únicamente por la imagen, sin las muletas que requerían los modelos anteriores.

Y en memoria y contexto largo: mantiene el foco a lo largo de millones de tokens y mejora sus propios resultados apoyándose en sus notas. Si trabajas con flujos largos y memoria entre sesiones, esa mejora va directa a tu caso.

Cómo funcionan las salvaguardas (y por qué a veces no te responde Fable)

Aquí está la parte que conviene entender bien, porque cambia lo que recibes.

Fable 5 no rechaza peticiones a la vieja usanza. Lleva un conjunto de clasificadores —sistemas de IA independientes— que vigilan tres áreas de alto riesgo: ciberseguridad, biología/química y destilación (intentos de copiar el modelo para entrenar otros). Cuando uno de esos clasificadores salta, la respuesta no la genera Fable 5: la genera Claude Opus 4.8, y se te avisa de ello.

Esto tiene tres lecturas prácticas:

  • No es un «no puedo ayudarte». Un fallback a Opus 4.8 sigue siendo una respuesta de un modelo muy capaz. Pierdes el plus de Fable, no la respuesta.
  • Es conservador a propósito. Anthropic admite haber calibrado los clasificadores tirando a estrictos: a veces saltan con peticiones inofensivas. De media se activan en menos del 5% de las sesiones, y más del 95% no los tocan; en esas, Fable 5 rinde igual que Mythos 5. Prometen ir afinándolos.
  • Biología es el área más restrictiva. Por ahora, la mayoría de consultas de biología y química caen a Opus, no solo las peligrosas. Si te mueves en ese terreno, tenlo presente.

¿Aguantan? Anthropic sometió las salvaguardas a un bug bounty externo de más de 1.000 horas sin que nadie encontrara un jailbreak universal (aunque reconocen que el instituto británico AISI avanzó hacia uno). Su objetivo no es una perfección imposible, sino hacer los jailbreaks lo bastante lentos y caros como para detectarlos antes de que se usen a escala.

Y un cambio que sí te toca si manejas datos sensibles: para todos los modelos clase Mythos, Anthropic exige retención de 30 días de todo el tráfico (en superficies propias y de terceros). No lo usan para entrenar, registran cada acceso humano y lo borran pasados esos 30 días. Si vas a mandar información delicada, encájalo en tu política —y, ya de paso, ten al día tu ciberseguridad y tus copias de seguridad.

Precio y disponibilidad: ojo a las fechas

Aquí la comparación con tu flujo actual se vuelve concreta:

  • Claude Fable 5: 10 $ por millón de tokens de entrada y 50 $ de salida.
  • Claude Opus 4.8: 5 $ y 25 $.

O sea, el doble que Opus 4.8, aunque menos de la mitad de lo que costaba Mythos Preview. El identificador para la API es claude-fable-5.

En disponibilidad, ojo al detalle: la API y los planes Enterprise por consumo lo tienen al 100% desde ya. Pero en suscripción el despliegue es escalonado:

  • Hasta el 22 de junio: incluido sin coste extra en Pro, Max, Team y Enterprise por asiento.
  • Desde el 23 de junio: se retira de esos planes y usarlo requerirá créditos de uso.
  • Más adelante: cuando haya capacidad, lo restaurarán como parte estándar.

¿Fable 5 o te quedas en Opus 4.8?

La decisión se reduce a coste contra complejidad de tarea.

Quédate en Opus 4.8 si:

  • Tu flujo va bien y trabajas sobre todo con tareas cortas o de complejidad media. Opus es excelente y cuesta la mitad.
  • Tocas mucho dominio de biología o química, donde Fable hará fallback a Opus de todas formas.
  • El presupuesto manda y el plus de capacidad no se traduce en ahorro real.

Da el salto a Fable 5 si:

  • Tienes tareas largas y de verdad complejas: migraciones masivas, refactors a escala, análisis multidocumento, automatizaciones agénticas de muchos pasos.
  • Quieres exprimir su eficiencia de tokens a esfuerzo medio para producción.
  • Trabajas con contexto largo y memoria persistente entre sesiones.

El doble de coste solo sale a cuenta si tus tareas son lo bastante largas y complejas como para que la capacidad extra se traduzca en menos iteraciones.

En resumen

Claude Fable 5 no es un Opus con esteroides: es un salto de categoría, el primero de la clase Mythos que puedes usar tú.

Para tu negocio, la pregunta no es «¿lo uso?», sino «¿dónde encaja sin tirar el dinero?». Y ahí es donde entramos: en Dualthink te ayudamos a decidir cómo meter este tipo de capacidad en tus procesos y automatizaciones de forma que ahorre tiempo y pasta. ¿Le damos una vuelta a tu caso?

What do you think?

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *