Ir directamente a la información del producto
1 de 1

Azure

Curso DP-203 Azure Data Engineer - Associate

Curso DP-203 Azure Data Engineer - Associate

Precio habitual $699.00 USD
Precio habitual $699.00 USD Precio de oferta $699.00 USD
Oferta Agotado
Impuesto incluido.

Clases Virtuales en Vivo

Via Zoom con profesor en linea para resolver todas tus dudas y consultas.
  • 24 horas académicas
  • Tipo de Cambio S/. 3.70
  • Nivel Intermedio
Ver todos los detalles

Beneficios del Curso

1 de 6

Nuestros alumnos certificados ahora trabajan en las compañías más exitosas

Temario del Curso

Tema 1: Diseño e implementación del almacenamiento de datos

Implementación de una estrategia de partición

  • Implementación de una estrategia de partición para los archivos
  • Implementación de una estrategia de partición para cargas de trabajo analíticas
  • Implementación de una estrategia de partición para cargas de trabajo de streaming
  • Implementación de una estrategia de partición para Azure Synapse Analytics
  • Identificación de cuándo se necesita crear particiones en Azure Data Lake Storage Gen2

Diseño e implementación de la capa de exploración de datos

  • Creación y ejecución de consultas mediante una solución de proceso que usa SQL sin servidor y un clúster de Spark
  • Recomendación e implementación de plantillas de bases de datos de Azure Synapse Analytics
  • Inserción de un linaje de datos nuevo o actualizado en Microsoft Purview
  • Examen y búsqueda de metadatos en el Catálogo de datos de Microsoft Purview

Tema 2: Desarrollo del procesamiento de datos: (1) Ingesta y transformación de datos (2) Desarrollo de una solución de procesamiento por lotes

Ingesta y transformación de datos

  • Diseño e implementación de cargas incrementales
  • Transformación de datos mediante Apache Spark
  • Transformación de datos mediante Transact-SQL (T-SQL) en Azure Synapse Analytics
  • Ingesta y transformación de datos mediante canalizaciones de Azure Synapse o Azure Data Factory
  • Transformación de datos con Azure Stream Analytics
  • Limpieza de datos
  • Control de datos duplicados
  • Evitar datos duplicados mediante la opción de entrega exactamente una vez de Azure Stream Analytics
  • Control de datos que faltan
  • Control de datos que llegan tarde
  • División de los datos
  • Fragmentación de JSON
  • Codificar y descodificar datos
  • Configuración del control de errores para una transformación
  • Normalización y desnormalización de datos
  • Realización de análisis exploratorios de los datos

Desarrollo de una solución de procesamiento por lotes

  • Desarrollo de soluciones de procesamiento por lotes mediante Azure Data Lake Storage, Azure Databricks, Azure Synapse Analytics y Azure Data Factory
  • Uso de PolyBase para cargar datos en un grupo de SQL
  • Implementación de Azure Synapse Link y consulta de los datos replicados
  • Creación de canalizaciones de datos
  • Escalado de recursos
  • Configuración del tamaño del lote
  • Creación de pruebas para canalizaciones de datos
  • Integración de cuadernos de Jupyter o Python en una canalización de datos
  • Actualización e inserción de datos
  • Reversión de los datos a un estado anterior
  • Configuración del control de excepciones
  • Configuración de la retención por lotes
  • Lectura y escritura en un lago delta

Tema 3: Desarrollo del procesamiento de datos: (3) Desarrollo de una solución de procesamiento de flujos (4) Administración de lotes y canalizaciones

Desarrollo de una solución de procesamiento de flujos

  • Creación de una solución de procesamiento de flujos mediante Stream Analytics y Azure Event Hubs
  • Procesamiento de datos mediante el flujo estructurado de Spark
  • Creación de agregados con ventanas
  • Control del desfase del esquema
  • Procesamiento de datos de serie temporal
  • Procesamiento de datos en particiones
  • Procesamiento en una partición
  • Configuración de puntos de comprobación y marcas de agua durante el procesamiento
  • Escalado de recursos
  • Creación de pruebas para canalizaciones de datos
  • Optimización de las canalizaciones con fines analíticos o transaccionales
  • Control de las interrupciones
  • Configuración del control de excepciones
  • Actualización e inserción de datos
  • Reproducción de datos de flujo archivados

Administración de lotes y canalizaciones

  • Desencadenamiento de lotes
  • Control de cargas por lotes con errores
  • Validación de cargas por lotes
  • Administración de canalizaciones de datos en Azure Data Factory o Azure Synapse
  • Programación de canalizaciones de datos en Data Factory o Azure Synapse
  • Implementación del control de versiones para artefactos de canalización
  • Administración de trabajos de Spark en una canalización

Tema 4: Protección y supervisión del almacenamiento y el procesamiento de datos

Implementación de la seguridad de datos

  • Implementación del enmascaramiento de datos
  • Cifrado de datos en reposo y en movimiento
  • Implementación de la seguridad de nivel de fila y de columna
  • Implementación del control de acceso basado en roles (RBAC) de Azure
  • Implementación de listas de control de acceso (ACL) de tipo POSIX para Data Lake Storage Gen2
  • Implementación de una directiva de retención de datos
  • Implementación de puntos de conexión seguros (privados y públicos)
  • Implementación de tokens de recursos en Azure Databricks
  • Carga de un objeto DataFrame con información confidencial
  • Escritura de datos cifrados en tablas o archivos Parquet
  • Administración de información confidencial

Supervisión del almacenamiento y el procesamiento de datos

  • Implementación del registro usado por Azure Monitor
  • Configuración de servicios de supervisión
  • Supervisión del procesamiento de flujos
  • Medición del rendimiento del movimiento de datos
  • Supervisión y actualización de estadísticas sobre los datos en un sistema
  • Supervisión del rendimiento de canalizaciones de datos
  • Medición del rendimiento de las consultas
  • Programación y supervisión de pruebas de canalización
  • Interpretación de métricas y registros de Azure Monitor
  • Implementación de una estrategia de alertas de canalización

Tema 5: Optimización y solución de problemas de almacenamiento y procesamiento de datos

Optimización y solución de problemas de almacenamiento y procesamiento de datos

  • Compactación de archivos pequeños
  • Control de la asimetría en los datos
  • Control del volcado de datos
  • Optimización de la administración de recursos
  • Optimización de consultas mediante indizadores
  • Optimización de consultas mediante la memoria caché
  • Solución de problemas de un trabajo de Spark con errores
  • Solución de problemas de una ejecución de canalización con errores, incluidas las actividades ejecutadas en servicios externos

Tema 6: Simulacro del examen oficial de certificación Data Engineer - Associate

Revisaremos a detalle la guía oficial en español del examen de certificación DP-203 Azure Data Engineer Associate para conocer los tips, consejos y estrategias de resolución. Además se realizará el Simulador Oficial del examen de Azure que consta de 50 preguntas, donde los alumnos podrán validar su conocimientos aprendidos y preparación impartida en clase.

HORARIO DE CLASES:

Inicio: Lunes 27 de mayo

Frecuencia: Lunes, miércoles y viernes
(8 clases de 3 horas cada una)

  • Lun, Mie, Vie
    (6 a 9 pm)

  • Lun, Mie, Vie
    (7 a 10 pm)

  • Lun, Mie, Vie
    (8 a 11 pm)

  • Lun, Mie, Vie
    (9 a 12 pm)

PRÁCTICAS UTILIZANDO LOS LABORATORIOS OFICIALES PARA LAS CERTIFICACIONES DE AZURE

Vas a poder practicar en la Consola de Azure desde la cuenta de Certimas y podrás hacer los laboratorios oficiales recomendados para cada una de los exámenes de certificación de Azure.

Si, Quiero Practicar