Ingeniero de datos

Presencial, Remoto

Publicado hace 10 meses

Data Engineer con experiencia mínima de cuatro años en desarrollo de procesos de ETL/ELT, con gran capacidad para el trabajo en equipo, capacidad de aprendizaje y proactividad.

Preferiblemente con titulación en ingeniería superior / grado master.

Competencias obligatorias:

Dominio del lenguaje Python.

Experiencia implementando procesos basados en Spark con PySpark.

Experiencia con desarrollos basados en Pandas.

Dominio lenguaje SQL y sistemas gestores de bb.dd. relacionales y no relacionales.

Programación Orientada a Objetos y patrones de desarrollo.

Control de versiones basado en Git / Git Flow.

Experiencia en desarrollos de DAGs basados en Apache Airflow.

Se valorará:

Experiencia en entorno AWS (S3, Boto3, Athena, Glue, …) y/o Azure (Azure Data Factory, Azure Data Lake Storage Gen 2, Synapse Analytics, …)

Programación basada en principios SOLID y arquitectura Clean Arquitecture

Desarrollo TDD (Test Driven Development) con unittest y pytest

Herramientas de desarrollo y gestión (Jira, Confluence, Bitbucket, Jenkins, Azure Devops, Visual Studio Code)

Implementaciones basadas en contenedores (Docker, Kubernetes)

Conocimientos de Microsoft PBI / Fabric

Experiencia en desarrollos de aplicaciones clientes de Apache Kafka.

Bash Scripting.

Nivel de inglés B2 o superior

Funciones:

Desarrollo de ETLs avanzadas para cubrir capacidades analíticas dando solución a las necesidades de negocio.

Análisis de ETL.

Realización de procesos de “Data Quality Assurance” en las diferentes fases de desarrollo del modelo analítico.

Características del Puesto

Categoría de Puesto

Ingeniería en Sistemas

Características del Puesto

Aplicar en linea