Python ETL Hexagonal Kit
🐍 Python ETL Hexagonal Kit
Un framework ETL production-ready con arquitectura hexagonal real.
Conecta cualquier fuente de datos a Parquet en minutos — sin tocar código.
¿Qué problema resuelve?
La mayoría de pipelines ETL en Python terminan siendo scripts monolíticos:
lógica de negocio mezclada con pandas, queries hardcodeadas, sin tests,
imposibles de mantener.
Este kit te da una base arquitectónica correcta desde el primer día:
dominio puro, ports bien definidos, infraestructura intercambiable y
configuración 100% declarativa por JSON.
Lo que lo diferencia
Arquitectura hexagonal real — no solo carpetas con el nombre.
El dominio no importa pandas. Los tests unitarios no necesitan archivos.
Extensible sin modificar código existente — para agregar MongoDB,
creas un archivo nuevo y registras el tipo. Open/Closed Principle aplicado.
Configuración por entorno — variables sensibles como `${POSTGRES_DSN}`
se resuelven desde el entorno, nunca se hardcodean en el JSON.
Exit codes semánticos — 0 éxito, 1 fallo, 2 parcial.
Integra con cron, Airflow o GitHub Actions sin configuración adicional.
Tech stack
`Python 3.11+` · `pandas 2.x` · `PyArrow 14+` · `psycopg2` · `openpyxl` · `requests`
Ver `SETUP.md` para la guía completa.
Licencia
Uso personal y comercial permitido. No redistribuir como template.