Claude Opus 4.6: El Modelo que Hundió la Bolsa y Ahora Quiere Tu Trabajo
Claude Opus 4.6: El Modelo que Hundió la Bolsa y Ahora Quiere Tu Trabajo
Esta semana ha pasado algo que no habíamos visto antes: una actualización de un modelo de IA ha provocado un pánico bursátil real. No un susto de un día como DeepSeek. Un desplome de $285.000 millones en capitalización bursátil en una sola sesión. Thomson Reuters cayó un 15,8%. LegalZoom un 19,7%. RELX, dueña de LexisNexis, se dejó un 14%. Salesforce, FactSet, Workday — todo rojo.
El detonante no fue Opus 4.6. Fue lo que vino justo antes: los plugins de Claude Cowork.
Y ahora, con Opus 4.6 recién salido del horno, la pregunta ya no es si la IA va a cambiar el trabajo del conocimiento. Es cuándo y cuánto.
Vamos por partes.
Qué es Claude Opus 4.6
Claude Opus 4.6 es el modelo más avanzado de Anthropic, lanzado el 5 de febrero de 2026. Es una actualización directa de Opus 4.5 (que salió en noviembre del año pasado) y pertenece a la familia Claude 4.5, que incluye también Sonnet 4.5 y Haiku 4.5.
No es un modelo nuevo desde cero. Es el mismo cerebro, más afinado. Piensa más antes de responder, planifica mejor las tareas largas, y sobre todo: no pierde el hilo en conversaciones enormes.
Las mejoras clave
Contexto de 1 millón de tokens (en beta). Esto es nuevo para la gama Opus. Para que te hagas una idea: 1 millón de tokens son aproximadamente 750.000 palabras, o el equivalente a 10 novelas completas en una sola conversación. El modelo anterior se quedaba en 200.000. Esto significa que puedes pasarle un codebase entero, o un dossier legal completo, y que lo procese sin perder el hilo.
Y no es solo que “admita” más texto. En un benchmark llamado MRCR v2 — que mide la capacidad de encontrar información enterrada en montañas de texto — Opus 4.6 saca un 76%. Sonnet 4.5 saca un 18,5%. No es una mejora incremental; es un salto cualitativo en cuánto contexto puede realmente usar sin degradarse.
Mejor en código, más agéntico. El modelo lidera Terminal-Bench 2.0 (benchmark de coding agéntico), es mejor revisando y depurando su propio código, y aguanta sesiones de trabajo más largas sin perder la calidad. SentinelOne reportó que manejó una migración de un codebase de millones de líneas “como un ingeniero senior”, planificando la estrategia y adaptándola sobre la marcha.
Mejor en tareas de conocimiento. En GDPval-AA — un benchmark que mide rendimiento en tareas reales de finanzas, legal y otros dominios — Opus 4.6 supera a GPT-5.2 de OpenAI por 144 puntos Elo y a su propio predecesor Opus 4.5 por 190 puntos. También es el mejor modelo en BrowseComp, que evalúa la capacidad de encontrar información difícil en la web.
Razonamiento más profundo. El modelo piensa más. A veces demasiado — Anthropic recomienda bajar el esfuerzo (/effort) a medio si ves que tarda mucho en preguntas simples. Pero en problemas complejos, esto marca la diferencia. Lidera Humanity’s Last Exam, un test multidisciplinar diseñado para evaluar razonamiento experto.
Descubrimiento de vulnerabilidades. Antes de su lanzamiento, el equipo de red de Anthropic le dio herramientas de análisis de seguridad y lo soltó contra código open source. Encontró más de 500 vulnerabilidades zero-day previamente desconocidas, validadas por investigadores externos. Fallos en GhostScript, OpenSC, CGIF… cosas que los fuzzers tradicionales no encontraron. Esto es un arma de doble filo: increíble para defensores, preocupante si cae en las manos equivocadas.
Lo que ha cambiado en la experiencia de uso
Aquí es donde la cosa se pone interesante para quienes usamos Claude a diario. Porque Opus 4.6 no es solo un modelo mejor — viene con cambios en la interfaz y herramientas nuevas que cambian cómo trabajas con él.
Composición de mensajes: el cuadro editable
Cuando le pides a Claude que te redacte un email, un mensaje de Slack o un texto, ahora no te lo suelta en el chat como si nada. Te lo presenta en un cuadro editable — puedes modificarlo directamente antes de copiarlo o enviarlo. Y si es un email, te da un botón para abrirlo directamente en Gmail.
Esto parece menor, pero cambia el flujo de trabajo. Antes: Claude escribe → copias → pegas en Gmail → editas. Ahora: Claude escribe → editas in situ → envías. Un paso menos, menos fricción.
Además, puede generar varias versiones del mismo mensaje con enfoques distintos. Por ejemplo, si le pides ayuda con un email difícil, puede darte una versión directa y otra más diplomática, cada una con su etiqueta. Tú eliges cuál encaja mejor.
Preguntas interactivas en lugar de texto
Otra novedad: cuando Claude necesita más contexto o quiere ayudarte a decidir, en vez de escribirte un párrafo con opciones, te muestra un modal interactivo con preguntas y opciones clicables. Si estás eligiendo entre varias opciones, te las presenta como botones en vez de una lista numerada.
Esto acelera mucho las conversaciones de ida y vuelta. En vez de “escríbeme 1, 2 o 3”, haces clic y sigues.
Creación de archivos nativos
Claude ya podía crear documentos, pero ahora es bastante más potente: genera Word (.docx), PowerPoint (.pptx), Excel (.xlsx), PDFs y código ejecutable. Para los que trabajamos con datos, poder pedirle “hazme un Excel con esta estructura” o “monta un PowerPoint con estos datos” y recibir el archivo listo para descargar es un salto importante.
Y hablando de PowerPoint: Claude en PowerPoint se lanza en preview. Puedes trabajar directamente dentro de PowerPoint con Claude como asistente lateral, creando y editando slides sin salir de la aplicación. Lee tus layouts, fuentes y templates y genera contenido que respeta el diseño corporativo.
Equipos de agentes (Agent Teams)
Esto es solo para Claude Code por ahora, pero es significativo: en vez de tener un solo agente trabajando secuencialmente, puedes montar un equipo de agentes que se reparten las tareas y trabajan en paralelo. Uno en el frontend, otro en la API, otro en la migración. Coordinándose entre ellos.
Scott White, Head of Product de Anthropic, lo compara con tener un equipo de humanos competentes trabajando para ti. La diferencia es que estos no se van a tomar café ni se distraen con Slack.
Compactación y thinking adaptativo
Dos mejoras más técnicas pero relevantes:
Compactación: El modelo puede resumir su propio contexto para seguir trabajando en tareas largas sin chocar contra los límites de tokens. Es como si pudiera tomar notas de lo que ya ha hecho para no tener que releerlo todo.
Thinking adaptativo: El modelo ajusta automáticamente cuánto “piensa” según la complejidad de la tarea. Para algo simple, va rápido. Para algo complejo, se toma su tiempo. Esto balancea coste, latencia y calidad sin que tengas que configurar nada.
Cowork y la “SaaSpocalypse”
Pero nada de esto provocó el pánico bursátil. Lo que lo provocó fueron los plugins de Cowork.
Cowork se lanzó el 12 de enero como preview. La idea es simple: le das acceso a Claude a una carpeta de tu escritorio y él lee, edita y crea archivos. Como un becario con superpoderes. El 30 de enero, Anthropic añadió plugins sectoriales: legal, ventas, finanzas, marketing, datos, soporte al cliente.
El plugin legal fue el que rompió todo. Puede revisar contratos, triagear NDAs, hacer seguimiento de compliance. Todo configurable para tu organización. Anthropic deja claro que los resultados deben ser revisados por abogados licenciados. Pero Wall Street no se paró a leer la letra pequeña.
El 3 de febrero, el mercado se derrumbó. Thomson Reuters perdió un 15,8% en un día — su peor caída en la historia. LegalZoom un 19,7%. RELX un 14%. Un ETF de software tuvo su peor sesión desde abril. Bloomberg habla de $285.000 millones evaporados. Ya lo llaman la “SaaSpocalypse”.
La lógica del mercado: si un modelo de IA general puede hacer lo que software especializado de miles de dólares al año hace, ¿por qué pagar por ese software?
Jensen Huang de Nvidia dice que es “ilógico”. Un analista de JP Morgan lo llama “un salto ilógico”. Otros recuerdan que cuando DeepSeek sacudió al mercado, Nvidia perdió $600.000M y luego se recuperó para llegar a $5 billones.
Pero hay algo diferente esta vez: no es solo hype. Los plugins de Cowork hacen cosas reales, ahora mismo, por $100/mes. Un abogado junior cobra bastante más que eso.
Precios y planes
Los precios del modelo no han cambiado: $5 por millón de tokens de entrada, $25 de salida en la API. Con prompt caching ahorras hasta un 90%, con batch processing un 50%.
Para el consumidor:
- Gratis: Acceso a Sonnet 4.5 con límites estrictos. Unas 30-100 mensajes al día.
- Pro ($20/mes): Acceso a todos los modelos (Opus 4.6, Sonnet 4.5, Haiku 4.5), Google Workspace, Claude Code, 5x más uso que free.
- Max 5x ($100/mes): 5 veces más uso que Pro. Cowork incluido.
- Max 20x ($200/mes): 20 veces más. Para quienes usan Claude todo el día.
- Team ($25-30/seat/mes): Para equipos de 5+. Admin centralizado, proyectos compartidos.
- Team Premium ($150/seat/mes): Incluye Claude Code.
- Enterprise: Precio personalizado. SSO, SCIM, audit logs, contexto de 500K, compliance.
El string del modelo en la API es claude-opus-4-6. Disponible también en AWS Bedrock, Google Vertex AI y Microsoft Foundry.
Mi perspectiva: lo que realmente importa
Llevo meses usando Claude para escribir este blog, para trabajar con datos, para programar. He visto la evolución desde Sonnet 3.5 hasta aquí. Y te digo lo que veo:
El salto no está en los benchmarks. Está en la consistencia. En que puedes darle una tarea compleja y que la termine sin que tengas que microgestionarla. En que mantiene el contexto durante sesiones largas sin degradarse. En que los archivos que genera son usables, no “casi bien”.
El cuadro editable de mensajes y el modal de preguntas son detalles de UX que parecen menores pero cambian cómo trabajas. Menos copiar y pegar, menos ida y vuelta, más flujo.
Los equipos de agentes son el futuro, aunque ahora mismo están en preview y solo para código. Cuando esto llegue a tareas de conocimiento general, el impacto será enorme.
Y la “SaaSpocalypse”… Mira, el mercado sobrereacciona. Siempre. Pero la dirección es clara: los modelos generalistas están comiéndose el terreno del software especializado. No mañana, no todo, pero sí poco a poco. Si tu negocio es vender software que hace una cosa específica que un LLM ya puede hacer, tienes un problema. No hoy. Pero sí en 2-3 años.
Lo que me parece más revelador es lo de las vulnerabilidades. Más de 500 zero-days encontrados “out of the box”, sin instrucciones específicas. Eso no es un modelo que responde preguntas. Es un modelo que investiga, razona, y descubre cosas que los humanos con herramientas tradicionales no encontraron. Para bien y para mal.
¿Merece la pena Opus 4.6?
Si usas Claude para trabajo serio — código, análisis de datos, documentación, investigación — sí. Es mejor que Opus 4.5 en todo lo que importa. El contexto de 1M tokens es un game-changer para trabajar con codebases grandes o documentos extensos.
Si eres usuario casual, Sonnet 4.5 sigue siendo excelente y más rápido. Opus 4.6 piensa más, lo que significa que a veces tarda más. Para preguntas simples, es como matar moscas a cañonazos.
Si eres desarrollador, el precio API es competitivo y las nuevas features (compactación, effort control, adaptive thinking) te dan más control sobre coste vs calidad.
Y si eres una empresa de software especializado que vende suscripciones de miles de euros… quizá es buen momento para repensar tu modelo de negocio.
Febrero 2026
Este artículo ha sido escrito con Claude Opus 4.6. Sí, el modelo sobre el que escribo. No, no le he pedido que se ponga medallas. Los datos vienen de Anthropic, CNBC, TechCrunch, Bloomberg, Axios, CNN, VentureBeat y Fast Company. Las opiniones son mías.
También te puede interesar
Tienes 3-5 años antes de que los agentes de IA sean normales
El 78% de ejecutivos cree que los ecosistemas digitales se construirán para humanos Y agentes. La ventana para posicionarte se cierra.
OpenClaw: El Asistente de IA Viral que No Voy a Instalar (Todavía)
42.000 instancias expuestas, vulnerabilidades críticas y tres rebrandings en tres meses. Por qué el proyecto más comentado del momento me genera más dudas que entusiasmo.
ChatGPT vs Gemini vs Claude: Comparativa 2026
Guía práctica para elegir entre los tres grandes LLMs. Precios, capacidades, casos de uso y cuál te conviene según tu situación.