Claude Mythos en 5 minutos
Lo importante, lo dudoso y lo que cambia de verdad
Desde noviembre de 2022, se repite el mismo ritual.
Sale un modelo nuevo. Entonces, el laboratorio de turno dice que supone un salto enorme. Aparecen benchmarks, casos espectaculares, promesas ambiciosas y, casi siempre, una conclusión más o menos implícita:
Esto cambia las reglas del juego.
Con Claude Mythos ha pasado algo parecido, pero con un giro más trascendental.
Esta vez el relato no va tanto de creatividad, ni de conversación, ni de productividad general. Va de programación, ciberseguridad, vulnerabilidades. Y va, sobre todo, de peligro.
Anthropic no ha presentado Mythos como otro modelo muy bueno. Lo ha presentado como algo tan potente en ciertas tareas de seguridad ofensiva que no puede abrirse al público sin más.
Y en este punto, te invito a hacer equilibrios. ¿Cómo evitar tragarse todo el marketing sin quitarle importancia a la noticia? Vamos a intentarlo.
Si tuviera que resumir mi opinión, sería así:
Mythos será muy probablemente un modelo muy potente, especialmente en programación, pero sigue siendo un LLM.
Y esa segunda parte importa tanto como la primera. Luego te hablo de ella.
De momento, te interesa saber que Anthropic afirma haber observado en Mythos capacidades muy avanzadas para encontrar y explotar vulnerabilidades, hasta el punto de justificar un acceso restringido y el lanzamiento de Project Glasswing, una iniciativa con grandes empresas tecnológicas (Amazon Web Services, Apple, Broadcom, Cisco, CrowdStrike, Google, JPMorgan, Linux Foundation, Microsoft, Nvidia y Palo Alto Networks) para usar el modelo con fines defensivos.
Sobre el papel, los ejemplos que enseñan son llamativos. Entre otros, hablan de:
Un bug de 27 años en OpenBSD que permitiría tumbar remotamente una máquina que responda por TCP.
Una vulnerabilidad antigua en FFmpeg, una de esas librerías críticas de todo Internet.
Cadenas de explotación en Linux y navegadores, donde el modelo no solo encuentra un fallo, sino que encadena varios para escalar el impacto.
No hace falta entrar en todos los detalles técnicos para vislumbrar la idea principal de todo esto.
Y es que Anthropic no está vendiendo Mythos como un chatbot más listo, sino como una máquina especialmente buena leyendo código, detectando fallos y empujando tareas de seguridad que hasta ahora exigían especialistas muy buenos.
Hasta aquí, todo es creíble.
No porque me crea sin más cada demo o cada cifra, sino porque encaja con la dirección general que llevamos viendo desde hace tiempo. Los modelos mejoran en razonamiento aplicado, en autonomía, en lectura de código y en capacidad para cumplimentar tareas técnicas.
Si te esfuerzas de verdad en entrenar un modelo en programación, lo lógico es que acabes construyendo un sistema especialmente fuerte en ese ámbito. Y si mejoras mucho en programación, también mejoras en seguridad, porque buena parte de la seguridad consiste precisamente en entender código, detectar fallos y probar caminos que otros no han visto.
El problema empieza cuando el avance real y el relato de marketing vienen empaquetados en la misma caja.
Algo que se nos olvida con frecuencia es que todos los datos importantes nos los da la propia empresa que necesita vender la urgencia de tener este modelo. Y eso no invalida automáticamente lo que cuenta, pero obliga a leerlo con cierta prudencia.
Es como cuando Apple te dice que el último iPhone es el mejor que ha fabricado nunca. Probablemente sea verdad. Pero también es exactamente lo que esperas que diga Apple.
Con la IA pasa algo parecido, solo que con una capa extra de dramatismo.
Llevamos años escuchando relatos fascinantes, casi místicos (¿el modelo no se llama Mythos?), sobre sistemas que cambian el mundo, alteran la historia o pueden convertirse en un peligro enorme.
A veces hay base técnica. Otras veces hay mucha escenografía. Y casi siempre hay ambas cosas a la vez.
En el caso de Mythos, el marco narrativo es muy conveniente para Anthropic. Si el modelo es impresionante, refuerza su posición tecnológica. Si además es “demasiado peligroso” para lanzarlo libremente, refuerza también su posición política y reputacional. No solo tienen una tecnología poderosa, también son los responsables que saben contenerla.
Es una narrativa tan eficaz que conviene cogerla con pinzas.
Además, hay algo importante que no deberíamos perder de vista: por muy bueno que sea Mythos, seguimos hablando de un LLM.
Eso significa que no estamos ante una máquina mágica ni ante una inteligencia infalible. Seguimos ante una tecnología que puede alucinar, equivocarse, generar código mediocre, tomar atajos descabellados y requerir validación humana. Puede ser excepcional en una franja de tareas y seguir teniendo límites muy claros fuera de ella.
De hecho, una de las cosas más interesantes del anuncio es precisamente esa: el relato se concentra muchísimo en programación y ciberseguridad. Eso sugiere que ahí es donde Anthropic cree que tiene un diferencial real.
El modelo per se no es “demasiado peligroso”. Solo dispara la escala, la velocidad y la autonomía con la que puede hacer tareas que antes dependían de expertos escasos y lentos. Puede convertirse en un depurador de bugs o en un cibercriminal. Depende de las manos en las que caiga.
Entonces, ¿con qué deberías quedarte? Yo lo tengo claro:
Conviene tomarse en serio los avances de Claude Mythos, pero no hace falta tragarse las luces y colores de la escenografía. La noticia es que seguimos viendo modelos cada vez más fuertes en programación y que las empresas que los construyen ya saben perfectamente cómo convertir ese avance en una historia de poder, responsabilidad y urgencia.
Apoya mi contenido
Si has llegado hasta aquí, ¡gracias por leerme!
¡Échame una mano para que esta newsletter llegue a más personas! Es muy fácil:
1️⃣ Comparte esta edición. Envíasela a amigos, conocidos o familiares. Seguro que conoces a alguien a quien le gustará leerla.
2️⃣ Dale un me gusta y deja un comentario. Así ayudas a que el post llegue a más personas y, de paso, me puedes dejar tu punto de vista. También puedes responder a este correo. ¡Estoy deseando leer qué opinas!
3️⃣ ¡Suscríbete! Así no te perderás las próximas ediciones donde te explico cómo funciona la IA, con criterio, y cómo está transformando nuestro mundo.
¡Nos vemos en la próxima!
Edgar.



