Claude Sonnet 5: qué es real y qué es ruido en el lanzamiento
Hoy Anthropic lanzó Claude Sonnet 5, y las redes se llenaron de capturas con números espectaculares: 92% en SWE-bench, 96% en razonamiento, 2 millones de tokens de contexto. Conviene empezar por algo incómodo: muchos de esos números son falsos. Vienen de un artículo que originalmente era una broma de April Fools y de páginas que lo replicaron sin verificar. Anthropic nunca los publicó.
Separemos entonces el ruido de lo real, porque el lanzamiento es importante, pero no por lo que se está diciendo.
Qué es de verdad Sonnet 5
No es un modelo más inteligente que el tope de la línea. La propia Anthropic no lo presenta así: lo posiciona como un modelo "cercano a Opus 4.8, a menor precio". Los números reales lo confirman:
- Trabajo de conocimiento: prácticamente empata a Opus 4.8.
- Coding agéntico: queda unos 6 puntos por debajo (63.2% frente a 69.2% de Opus).
- Razonamiento difícil y seguridad: Opus 4.8 sigue adelante.
Es, eso sí, el Sonnet más "agéntico" hasta ahora: mejor en tareas largas de varios pasos, en uso de herramientas y en control de computadora, donde las versiones anteriores se quedaban cortas.
El verdadero cambio: el precio
Sonnet 5 cuesta alrededor de 40% menos que Opus 4.8 (3 y 15 dólares por millón de tokens de entrada y salida, frente a 5 y 25 de Opus). Con el precio de lanzamiento, hasta fin de agosto, el ahorro llega a cerca del 60%. Y es el modelo por defecto en los planes Free y Pro, disponible en casi todas las plataformas.
Lo que el comunicado no dice
Para ser honestos, no todo es ahorro:
- Usa más tokens que la versión anterior para la misma tarea, así que parte del descuento se diluye en la cuenta final.
- Es más lento y más verboso que Sonnet 4.6.
- En pruebas reales independientes mejora generando código, pero empeoró detectando errores cuando se lo usa para revisar.
Por qué esto importa para tu negocio
La noticia no es "salió una IA más inteligente". Es "salió una IA casi igual de capaz, mucho más barata y disponible en todos lados". Y ese es un cambio más profundo de lo que parece.
Cuando una empresa automatiza con agentes de IA, la mayor parte del trabajo (rutear una consulta, clasificar un lead, extraer datos de un mensaje, llamar a una herramienta) no necesita el modelo más potente del mundo. Necesita el modelo correcto para cada tarea, al menor costo posible, bien orquestado.
Ahí está el verdadero juego. La competencia entre modelos ya no se gana solo con "el más inteligente", sino con quien sabe usarlos mejor: qué tarea va a qué modelo, con qué límites, con qué supervisión. Eso es lo que separa un sistema que rinde de una factura inflada que no agrega valor.
Hablemos
En AgentesNexo construimos justamente eso: agentes con el modelo justo para cada trabajo, con un alcance claro, no el más caro por default. Si querés automatizar tu operación sin terminar pagando de más ni supervisando máquinas todo el día, escribinos.
En AgentesNexo construimos agentes con el modelo justo para cada trabajo, con un alcance claro, no el más caro por default. Si querés automatizar tu operación sin pagar de más, escríbenos en agentesnexo.com o por WhatsApp al +591 67564218.