Temario del curso
Introducción a Apache Iceberg
- Visión general de Apache Iceberg
- Importancia y casos de uso en la arquitectura de datos moderna
- Características principales y beneficios
Conceptos básicos
- Formato y arquitectura de las tablas Iceberg
- Comparación con otros formatos de tabla
- Particionamiento y evolución del esquema
- Viaje en el tiempo y versionado de datos
Configuración de Apache Iceberg
- Instalación y configuración
- Integración de Iceberg con diversos motores de procesamiento de datos
- Configuración de un entorno Iceberg en una máquina local
Operaciones básicas
- Crear y administrar tablas Iceberg
- Escribir y leer datos en las tablas Iceberg
- Operaciones CRUD básicas
Migración de datos e integración
- Migrar datos desde Hive y otros sistemas a Iceberg
- Integración con herramientas de BI
- Migrar un conjunto de datos de muestra a Iceberg
Optimización del rendimiento
- Técnicas de optimización del rendimiento
- Optimizar consultas y escaneos de datos
- Optimización del rendimiento en Iceberg
Visión general de características avanzadas
- Evolución de particiones y particionamiento oculto
- Evolución de tablas y cambios de esquema
- Viaje en el tiempo y funciones de reversión
- Implementación de características avanzadas en Iceberg
Resumen y próximos pasos
Requerimientos
- Familiaridad con conceptos como tablas, esquemas, particiones y ingestión de datos
- Conocimientos básicos de SQL
Audiencia
- Ingenieros de datos
- Arquitectos de datos
- Analistas de datos
- Desarrolladores de software
Testimonios (5)
Los ejemplos en vivo
Ahmet Bolat - Accenture Industrial SS
Curso - Python, Spark, and Hadoop for Big Data
Traducción Automática
muy interactivo...
Richard Langford
Curso - SMACK Stack for Data Science
Traducción Automática
Suficiente práctica, el instructor es conocedor
Chris Tan
Curso - A Practical Introduction to Stream Processing
Traducción Automática
Aprende sobre Spark Streaming, Databricks y AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Curso - Apache Spark in the Cloud
Traducción Automática
tareas de práctica
Pawel Kozikowski - GE Medical Systems Polska Sp. Zoo
Curso - Python and Spark for Big Data (PySpark)
Traducción Automática