Skip to product information
1 of 1

Azure

Curso DP-203 Azure Data Engineer - Associate

Curso DP-203 Azure Data Engineer - Associate

Regular price $699.00 USD
Regular price $699.00 USD Sale price $699.00 USD
Sale Sold out
Tax included.

Clases Virtuales en Vivo

Via Zoom con profesor en linea para resolver todas tus dudas y consultas.
  • 24 horas académicas
  • Tipo de Cambio S/. 3.70
  • Nivel Intermedio
View full details

Beneficios del Curso

1 of 6

Nuestros alumnos certificados ahora trabajan en las compañías más exitosas

Temario del Curso

Tema 1: Diseño e implementación del almacenamiento de datos

Implementación de una estrategia de partición

  • Implementación de una estrategia de partición para los archivos
  • Implementación de una estrategia de partición para cargas de trabajo analíticas
  • Implementación de una estrategia de partición para cargas de trabajo de streaming
  • Implementación de una estrategia de partición para Azure Synapse Analytics
  • Identificación de cuándo se necesita crear particiones en Azure Data Lake Storage Gen2

Diseño e implementación de la capa de exploración de datos

  • Creación y ejecución de consultas mediante una solución de proceso que usa SQL sin servidor y un clúster de Spark
  • Recomendación e implementación de plantillas de bases de datos de Azure Synapse Analytics
  • Inserción de un linaje de datos nuevo o actualizado en Microsoft Purview
  • Examen y búsqueda de metadatos en el Catálogo de datos de Microsoft Purview

Laboratorio práctico para:

  • Explorar Azure Synapse Analytics
  • Transformación de archivos mediante un grupo de SQL sin servidor
  • Crear base de datos de lago

Tema 2: Desarrollo del procesamiento de datos: (1) Ingesta y transformación de datos (2) Desarrollo de una solución de procesamiento por lotes

Ingesta y transformación de datos

  • Diseño e implementación de cargas incrementales
  • Transformación de datos mediante Apache Spark
  • Transformación de datos mediante Transact-SQL (T-SQL) en Azure Synapse Analytics
  • Ingesta y transformación de datos mediante canalizaciones de Azure Synapse o Azure Data Factory
  • Transformación de datos con Azure Stream Analytics
  • Limpieza de datos
  • Control de datos duplicados
  • Evitar datos duplicados mediante la opción de entrega exactamente una vez de Azure Stream Analytics
  • Control de datos que faltan
  • Control de datos que llegan tarde
  • División de los datos
  • Fragmentación de JSON
  • Codificar y descodificar datos
  • Configuración del control de errores para una transformación
  • Normalización y desnormalización de datos
  • Realización de análisis exploratorios de los datos

Desarrollo de una solución de procesamiento por lotes

  • Desarrollo de soluciones de procesamiento por lotes mediante Azure Data Lake Storage, Azure Databricks, Azure Synapse Analytics y Azure Data Factory
  • Uso de PolyBase para cargar datos en un grupo de SQL
  • Implementación de Azure Synapse Link y consulta de los datos replicados
  • Creación de canalizaciones de datos
  • Escalado de recursos
  • Configuración del tamaño del lote
  • Creación de pruebas para canalizaciones de datos
  • Integración de cuadernos de Jupyter o Python en una canalización de datos
  • Actualización e inserción de datos
  • Reversión de los datos a un estado anterior
  • Configuración del control de excepciones
  • Configuración de la retención por lotes
  • Lectura y escritura en un lago delta

Laboratorio práctico para:

  • Transformación de Datos con Spark en Azure Synapse Analytics
  • Uso de Delta Lake con Spark en Azure Synapse Analytics
  • Cargar datos en un almacén de datos relacional
  • Construir una canalización de datos con Azure Synapse Analytics
  • Uso de un cuaderno de Apache Spark en un pipeline

Tema 3: Desarrollo del procesamiento de datos: (3) Desarrollo de una solución de procesamiento de flujos (4) Administración de lotes y canalizaciones

Desarrollo de una solución de procesamiento de flujos

  • Creación de una solución de procesamiento de flujos mediante Stream Analytics y Azure Event Hubs
  • Procesamiento de datos mediante el flujo estructurado de Spark
  • Creación de agregados con ventanas
  • Control del desfase del esquema
  • Procesamiento de datos de serie temporal
  • Procesamiento de datos en particiones
  • Procesamiento en una partición
  • Configuración de puntos de comprobación y marcas de agua durante el procesamiento
  • Escalado de recursos
  • Creación de pruebas para canalizaciones de datos
  • Optimización de las canalizaciones con fines analíticos o transaccionales
  • Control de las interrupciones
  • Configuración del control de excepciones
  • Actualización e inserción de datos
  • Reproducción de datos de flujo archivados

Administración de lotes y canalizaciones

  • Desencadenamiento de lotes
  • Control de cargas por lotes con errores
  • Validación de cargas por lotes
  • Administración de canalizaciones de datos en Azure Data Factory o Azure Synapse
  • Programación de canalizaciones de datos en Data Factory o Azure Synapse
  • Implementación del control de versiones para artefactos de canalización
  • Administración de trabajos de Spark en una canalización

Laboratorio práctico para:

  • Gestionar Azure Synapse Link para Azure Cosmos DB
  • Gestionar Azure Synapse Link para SQL
  • Gestionar Azure Stream Analytics
  • Ingesta de datos en tiempo real con Azure Stream Analytics and Azure Synapse Analytics

Tema 4: Protección y supervisión del almacenamiento y el procesamiento de datos

Implementación de la seguridad de datos

  • Implementación del enmascaramiento de datos
  • Cifrado de datos en reposo y en movimiento
  • Implementación de la seguridad de nivel de fila y de columna
  • Implementación del control de acceso basado en roles (RBAC) de Azure
  • Implementación de listas de control de acceso (ACL) de tipo POSIX para Data Lake Storage Gen2
  • Implementación de una directiva de retención de datos
  • Implementación de puntos de conexión seguros (privados y públicos)
  • Implementación de tokens de recursos en Azure Databricks
  • Carga de un objeto DataFrame con información confidencial
  • Escritura de datos cifrados en tablas o archivos Parquet
  • Administración de información confidencial

Supervisión del almacenamiento y el procesamiento de datos

  • Implementación del registro usado por Azure Monitor
  • Configuración de servicios de supervisión
  • Supervisión del procesamiento de flujos
  • Medición del rendimiento del movimiento de datos
  • Supervisión y actualización de estadísticas sobre los datos en un sistema
  • Supervisión del rendimiento de canalizaciones de datos
  • Medición del rendimiento de las consultas
  • Programación y supervisión de pruebas de canalización
  • Interpretación de métricas y registros de Azure Monitor
  • Implementación de una estrategia de alertas de canalización

Laboratorio práctico para:

  • Crear reporte en tiempo real con Azure Stream Analytics y Microsoft Power BI
  • Gestionar Microsoft Purview con Azure Synapse Analytics
  • Explorar Azure Databricks
    Gestionar Apache Spark in Azure Databricks
  • Automatizar un cuaderno de Azure Databricks con Azure Data Factory

Tema 5: Optimización y solución de problemas de almacenamiento y procesamiento de datos

Optimización y solución de problemas de almacenamiento y procesamiento de datos

  • Compactación de archivos pequeños
  • Control de la asimetría en los datos
  • Control del volcado de datos
  • Optimización de la administración de recursos
  • Optimización de consultas mediante indizadores
  • Optimización de consultas mediante la memoria caché
  • Solución de problemas de un trabajo de Spark con errores
  • Solución de problemas de una ejecución de canalización con errores, incluidas las actividades ejecutadas en servicios externos

Tema 6: Simulacro del examen oficial de certificación Data Engineer - Associate

Revisaremos a detalle la guía oficial en español del examen de certificación DP-203 Azure Data Engineer Associate para conocer los tips, consejos y estrategias de resolución. Además se realizará el Simulador Oficial del examen de Azure que consta de 50 preguntas, donde los alumnos podrán validar su conocimientos aprendidos y preparación impartida en clase.

HORARIO DE CLASES:

Inicio: Lunes 11 de noviembre

Frecuencia: Lunes, miércoles y viernes
(8 clases de 3 horas cada una)

  • Lun, Mie, Vie
    (6 a 9 pm)

  • Lun, Mie, Vie
    (7 a 10 pm)

  • Lun, Mie, Vie
    (8 a 11 pm)

  • Lun, Mie, Vie
    (9 a 12 pm)

PRÁCTICAS UTILIZANDO LOS LABORATORIOS OFICIALES PARA LAS CERTIFICACIONES DE AZURE

Vas a poder practicar en la Consola de Azure desde la cuenta de Certimas y podrás hacer los laboratorios oficiales recomendados para cada una de los exámenes de certificación de Azure.

Si, Quiero Practicar

PROFESOR DE AZURE

Ing. Nicolás Vargas

Docente certificado en Azure con 4 años de experiencia profesional. Actuamente se desempeña como consultor Microsoft Azure SWATe instructor de Azure en Intelligent Training, además como instructor y mentor de Microsoft Azure en Alkemy, entre otros. Tienecertificaciones internacionales: Microsoft Certified Azure Fundamentals, Microsoft Certified Azure Data Fundamentals, Microsoft Certified Azure AI Fundamentals, Microsoft Certified Azure Administrator Associate, Microsoft Certified Azure Data Engineer Associate.

Ver en Linkedin