La gran mentira de los copilots: por qué el 95% de las empresas no ven resultados
Por qué los asistentes de IA no están cumpliendo sus promesas — y qué hacer al respecto
La paradoja que nadie quiere admitir
En julio de 2025, un grupo de desarrolladores de software experimentados participó en un estudio que cambiaría la narrativa sobre la IA en el trabajo. El experimento era sencillo: completar tareas de su propio código, la mitad con herramientas de IA y la mitad sin ellas.
Los desarrolladores predijeron que la IA los haría un 24% más rápidos.
El resultado real: tardaron un 19% más con IA que sin ella.
Pero aquí viene lo más revelador: incluso después del experimento, los desarrolladores seguían creyendo que habían sido más rápidos con IA. Estimaron una mejora del 20% cuando en realidad habían empeorado.
Este estudio de METR (Model Evaluation and Threat Research) captura perfectamente la desconexión entre percepción y realidad que está definiendo la adopción de IA en 2025-2026.
El 95% que nadie menciona en las keynotes
Si el estudio de METR fuera un caso aislado, podríamos descartarlo. Pero no lo es.
Un informe del MIT publicado en agosto de 2025 analizó 300 despliegues de IA generativa en empresas. El resultado: solo el 5% logró aceleración rápida de ingresos. La gran mayoría se estancó sin impacto medible en el P&L.
El mismo informe reveló algo interesante sobre cómo las empresas adoptan IA:
- Soluciones compradas a vendors especializados: 67% de éxito
- Construcciones internas: ~22% de éxito (un tercio del anterior)
Esto contradice la tendencia de muchas empresas, especialmente en sectores regulados como banca y seguros, de construir sus propios sistemas propietarios de IA generativa.
El meta-análisis que desmonta el hype
Para los que piensan que estos son casos puntuales, un meta-análisis publicado en California Management Review en octubre de 2025 puso los números sobre la mesa.
Los investigadores analizaron 371 estimaciones de estudios publicados entre 2019 y 2024. Su conclusión: no existe una relación robusta entre la adopción de IA y ganancias de productividad agregada una vez que se controla la heterogeneidad metodológica y el sesgo de publicación.
En otras palabras: los estudios que muestran mejoras dramáticas suelen tener problemas metodológicos, muestras pequeñas, o —curiosamente— están financiados por empresas que venden herramientas de IA.
El problema específico del código: deuda técnica inducida por IA
Para los que trabajamos en tecnología, el caso del desarrollo de software es especialmente relevante.
GitClear, una empresa de analytics para desarrolladores, analizó 153 millones de líneas de código comparando patrones antes y después de la adopción masiva de herramientas como GitHub Copilot.
Su hallazgo: la IA destaca en añadir código rápidamente, pero genera lo que ellos llaman “deuda técnica inducida por IA”.
“El código añadido rápidamente es deseable si trabajas en aislamiento o en un problema greenfield. Pero el código añadido precipitadamente es tóxico para los equipos que deben mantenerlo después.” — Bill Harding, fundador de GitClear
Un review sistemático de 37 estudios sobre asistentes de código LLM (julio 2025) confirma el patrón: aunque los desarrolladores pasan menos tiempo en código boilerplate y búsquedas de API, las regresiones de calidad y el retrabajo posterior frecuentemente anulan las ganancias de velocidad, especialmente en tareas complejas.
¿Por qué ocurre esto?
Hay varios factores que explican esta desconexión:
1. La curva J de adopción
Según investigadores del MIT Sloan, las empresas manufactureras que adoptan IA frecuentemente experimentan pérdidas de productividad iniciales antes de ver mejoras. Esta “curva J” se debe a la desalineación entre herramientas digitales y procesos legacy, además de la inversión necesaria en infraestructura de datos, formación y rediseño de workflows.
2. El contexto que la IA no tiene
Los desarrolladores experimentados del estudio METR llevaban años trabajando en sus propios proyectos. Tenían contexto acumulado que ningún asistente de IA poseía. Terminaban adaptando su agenda y estrategias de resolución de problemas a los outputs de la IA, además de dedicar tiempo considerable a depurar código generado.
3. La ilusión de velocidad
Hay algo psicológicamente satisfactorio en ver código aparecer rápidamente en pantalla. Pero la velocidad de generación no equivale a productividad real. Si pasas 2 horas generando código y 4 horas arreglándolo, no has ganado tiempo.
4. Métricas equivocadas
Muchas empresas miden “tiempo ahorrado” basándose en autoreportes. El meta-análisis de California Management Review encontró que cuando se usan métricas objetivas en lugar de autoreportadas, las ganancias desaparecen o se reducen drásticamente.
Qué están haciendo las empresas inteligentes
El panorama no es completamente negativo. Las organizaciones que sí están viendo resultados comparten ciertas características:
Consolidación sobre fragmentación
Después de un 2025 de adopción masiva de copilots dispersos, los CIOs están pasando de experimentos fragmentados a estrategias holísticas. Menos herramientas, mejor integradas.
Gobernanza desde el diseño
En lugar de añadir controles después, las empresas exitosas incorporan gobernanza de IA desde el principio del proceso de adopción.
Métricas de valor reales
Abandonar los autoreportes y medir impacto real: tasas de defectos, tiempos de ciclo completo, satisfacción del cliente, no solo “líneas de código generadas”.
Segmentación por caso de uso
El mismo estudio de Brynjolfsson que se cita para promocionar la IA también muestra que los beneficios son altamente desiguales: los trabajadores del cuartil inferior de rendimiento vieron mejoras del 35%, mientras que los veteranos experimentados casi no vieron ganancia. La IA funciona mejor como nivelador que como multiplicador universal.
Mi perspectiva como data engineer
Trabajo diariamente con datos, pipelines y automatización. Y uso herramientas de IA regularmente. Mi experiencia confirma lo que muestran los estudios:
Donde la IA me ayuda:
- Boilerplate y código repetitivo
- Explorar APIs que no conozco
- Primera versión de scripts simples
- Traducir entre lenguajes o frameworks
Donde la IA me ralentiza:
- Lógica de negocio compleja que requiere contexto
- Debugging de problemas sutiles
- Código que debe integrarse con sistemas existentes
- Cualquier cosa que requiera entender “por qué” además de “qué”
La clave no es abandonar las herramientas de IA, sino ser brutalmente honesto sobre cuándo ayudan y cuándo no.
Un ejemplo concreto: el código generado por IA puede funcionar perfectamente y tener agujeros de seguridad enormes. “Funciona” y “está bien” no son lo mismo.
Conclusión: El fin del pensamiento mágico
2026 está siendo el año del ajuste de expectativas. La promesa de que la IA aumentaría el PIB un 15% y la productividad un 25% choca con la realidad de empresas que no ven retorno de sus inversiones.
Esto no significa que la IA sea inútil. Significa que:
- No es una solución universal — funciona en contextos específicos
- Requiere inversión en cambio organizacional — no solo en licencias
- Las métricas importan — mide lo que realmente importa, no lo que es fácil medir
- El expertise humano sigue siendo valioso — especialmente el contexto acumulado
La ventaja competitiva está cambiando de “quién tiene más herramientas de IA” a “quién entiende mejor cuándo y cómo usarlas”.
Y eso, irónicamente, es una habilidad muy humana.
¿Hay excepciones a esta regla del 95%? Sí. En Euskadi, las empresas que usan IA facturan un 8,7% más. La diferencia está en cómo lo implementan: ecosistema antes que herramientas, gobernanza desde el diseño, métricas de valor reales.
Fuentes
- METR (2025). “Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity”
- MIT NANDA Initiative (2025). “The GenAI Divide: State of AI in Business 2025”
- California Management Review (2025). “Seven Myths about AI and Productivity: What the Evidence Really Says”
- GitClear (2025). Análisis de 153 millones de líneas de código
- Mohamed et al. (2025). Review sistemático de 37 estudios sobre asistentes LLM para desarrollo de software
También te puede interesar
El 17% de empresas vascas usa IA — y facturan un 8,7% más: qué están haciendo diferente
Mientras el 95% de pilotos de IA fracasan globalmente, Euskadi muestra un modelo que sí funciona. Análisis del diagnóstico BAIC 2025.
Los datacenters ya consumen el 4% de la electricidad de EEUU — y Microsoft está reactivando una central nuclear
La demanda energética de la IA está resucitando Three Mile Island. Análisis del renacimiento nuclear impulsado por Big Tech y sus implicaciones.
Datos Sintéticos: El Negocio de $8 Mil Millones de Inventar Datos (Reales)
Nvidia pagó $320M por Gretel Labs. El mercado de datos sintéticos explota. Qué son, para qué sirven y por qué deberías conocerlos ya.