Por qué dejé de ser 'el de los dashboards' y aprendí Data Engineering
TL;DR
- Ser “el de Power BI” tiene un techo muy bajo
- El problema no son los dashboards, es que no controlas los datos que llegan
- Data Engineering no es “programar mucho”, es entender el flujo completo de datos
- El salto no es tan difícil si ya trabajas con datos (ya tienes la mentalidad)
- Lo que más vale no es la herramienta, es saber qué preguntas hacer
Voy a contarte algo que nadie me dijo cuando empecé a trabajar con datos.
Durante años fui “el de los dashboards”. El que sabía Power BI. El que hacía los informes bonitos. El que todo el mundo llamaba cuando necesitaban “un numerito”.
Y me sentía atascado.
El problema que nadie te cuenta
Cuando eres analista de datos en una empresa (no en una consultora, en una empresa normal), pasan cosas que los cursos no mencionan:
Nadie sabe más que tú. No hay un senior al que preguntar. No hay un equipo de datos. Eres tú, solo, intentando que los números cuadren.
Los datos son un desastre. El 90% son basura que nadie sabe procesar. Tienes 47 excels, 3 sistemas que no hablan entre sí, y un ERP del año 2008.
Tu trabajo es apagar fuegos. No tienes tiempo para “hacer las cosas bien”. El jefe quiere el informe para ayer. Copias y pegas. Funciona. Sigues adelante.
Sientes que te estancas. Sabes hacer dashboards. Sabes DAX. Sabes Power Query. ¿Y ahora qué? ¿Más dashboards? ¿Para siempre?
Si algo de esto te suena, bienvenido al club.
El momento en que todo cambió
Para mí el click fue una pregunta simple: ¿de dónde vienen estos datos?
Llevaba meses haciendo informes de ventas. Los datos llegaban a un Excel compartido cada lunes. Yo los transformaba en Power Query, hacía mis cálculos en DAX, y generaba el dashboard.
Un día los números no cuadraban. Pasé horas revisando mis fórmulas. Todo estaba bien. El problema estaba antes de que los datos llegaran a mí.
Alguien había cambiado el formato de exportación del CRM. Nadie me avisó. Nadie sabía que me afectaba.
Y ahí entendí: yo no controlaba nada. Era un consumidor de datos, no un creador. Dependía de que otros hicieran bien su parte, y cuando fallaban, yo era el que daba la cara.
Qué es realmente Data Engineering
Data Engineering no es “programar mucho”. No es saber Python o SQL a nivel experto (aunque ayuda). No es tener un máster en Big Data.
Data Engineering es entender y controlar el flujo completo de datos:
- De dónde vienen (fuentes, APIs, bases de datos, excels malditos)
- Cómo se transforman (limpieza, validación, enriquecimiento)
- Dónde se guardan (data warehouses, lakes, lo que sea)
- Cómo llegan a los consumidores (analistas, dashboards, modelos ML)
Cuando entiendes esto, dejas de ser “el de los dashboards” y te conviertes en “el que entiende cómo funcionan los datos de la empresa”.
Ese cambio de perspectiva vale más que cualquier certificación.
Lo que aprendí en el camino
1. SQL es tu mejor amigo
Power Query está bien, pero SQL es el lenguaje universal de los datos. Cualquier base de datos lo entiende. Cualquier herramienta de BI lo soporta. Aprenderlo bien fue lo mejor que hice.
2. Python no da tanto miedo
No necesitas ser programador. Necesitas saber automatizar cosas. Leer un CSV, transformarlo, guardarlo en otro sitio. Eso es el 80% del Python que uso.
3. Los pipelines son tu libertad
Un pipeline de datos es simplemente: “coge datos de aquí, transfórmalos así, guárdalos allá”. Cuando sabes hacer esto, dejas de depender de excels manuales.
4. La calidad de datos es lo que importa
Puedes tener el dashboard más bonito del mundo. Si los datos están mal, no sirve de nada. Data-Centric AI no es solo para Machine Learning, es para todo.
5. Documentar te salva la vida
Cuando eres el único que sabe cómo funcionan las cosas, documentar es supervivencia. Cuando vuelves a tu propio código 6 meses después, te lo agradeces.
El salto no es tan difícil
Si ya trabajas con datos, ya tienes la mentalidad más importante: hacerte preguntas sobre los datos.
- ¿Esto tiene sentido?
- ¿De dónde viene este número?
- ¿Por qué no cuadra con lo otro?
Eso es lo difícil de enseñar. Las herramientas se aprenden.
Lo que necesitas añadir:
| Ya tienes | Necesitas añadir |
|---|---|
| Power Query | SQL, algo de Python |
| Limpiar datos manualmente | Automatizar con pipelines |
| Dashboards | Entender el flujo completo |
| Resolver problemas puntuales | Pensar en sistemas |
Por dónde empezar
Si estás donde yo estaba, esto es lo que haría:
1. Aprende SQL de verdad No solo SELECT básicos. JOINs, subqueries, window functions. SQLBolt y Mode Analytics tienen tutoriales gratis.
2. Automatiza algo que hagas manualmente Ese excel que copias y pegas cada semana. Ese informe que generas a mano. Automatízalo con Python. Aunque tarde más la primera vez, la segunda ya has ganado.
3. Entiende de dónde vienen tus datos Habla con quien gestiona los sistemas. Pregunta cómo se exportan los datos. Entiende qué puede fallar y por qué.
4. Lee sobre arquitectura de datos No para implementarla mañana, sino para entender el vocabulario: data warehouses, lakes, ETL, ELT. Cuando entiendas los conceptos, todo lo demás encaja.
El resultado
Hoy no soy “el de los dashboards”. Soy el que entiende cómo funcionan los datos.
Cuando algo falla, sé dónde buscar. Cuando alguien pide un dato nuevo, sé si es posible y qué implica. Cuando hay que decidir entre dos herramientas, tengo criterio para opinar.
Y lo más importante: ya no me siento atascado.
El techo de “analista que sabe Power BI” es bajo. El techo de “persona que entiende datos de principio a fin” es mucho más alto.
Si estás donde yo estaba, plantéatelo. El salto merece la pena.
¿Estás en esa transición? ¿Te sientes atascado haciendo dashboards? Cuéntame tu situación.
También te puede interesar
El 90% de tus datos son basura que nadie sabe procesar
Por qué las empresas compran IA sin tener los datos listos. El problema de la fontanería de datos.
Guía de Data Engineering: De Excel a Pipelines Profesionales
Qué es un Data Engineer, qué herramientas usa, cómo es el día a día real, y cómo empezar si vienes del mundo Excel/Power BI.
Data Fabric: qué es y por qué te importa
Arquitectura unificada de datos sin importar dónde estén. Qué significa para un data engineer y cómo se relaciona con lo que ya usas.