Programa del Curso

Big Data Resumen:

  • ¿Qué es Big Data?
  • Por qué Big Data está ganando popularidad
  • Estudios de casos de Big Data
  • Características de Big Data
  • Soluciones para trabajar con Big Data.

Hadoop y sus componentes:

  • ¿Qué es Hadoop y cuáles son sus componentes?
  • Arquitectura de Hadoop y las características de los datos que puede manejar/procesar.
  • Breve historia de Hadoop, empresas que lo usan y por qué comenzaron a usarlo.
  • Marco de trabajo de Hadoop y sus componentes - explicados en detalle.
  • ¿Qué es HDFS y lecturas-escrituras al Sistema de Archivos Distribuido de Hadoop?
  • Cómo configurar un clúster de Hadoop en diferentes modos - Stand-alone/Pseudo/Multi Node cluster.

(Esto incluye la configuración de un clúster de Hadoop en VirtualBox/KVM/VMware, las configuraciones de red que deben ser revisadas cuidadosamente, ejecutar demonios de Hadoop y probar el clúster).

  • ¿Qué es el marco de trabajo Map Reduce y cómo funciona?
  • Ejecutando trabajos de Map Reduce en un clúster de Hadoop.
  • Comprender replicación, espejado y conciencia de rack en el contexto de los clústers de Hadoop.

Planificación del Clúster de Hadoop:

  • Cómo planificar tu clúster de hadoop.
  • Comprender hardware-software para planificar tu clúster de hadoop.
  • Entender los trabajos y planear el clúster para evitar fallos y rendimiento óptimo.

¿Qué es MapR y por qué MapR?

  • Resumen de MapR y su arquitectura.
  • Comprender y trabajar con el Sistema de Control de MapR, Volúmenes de MapR, instantáneas y espejos.
  • Planificar un clúster en el contexto de MapR.
  • Comparación de MapR con otras distribuciones y Apache Hadoop.
  • Instalación y despliegue del clúster de MapR.

Configuración e administración del clúster:

  • Administrar servicios, nodos, instantáneas, volúmenes espejos y clusters remotos.
  • Comprender y administrar Nodos.
  • Comprensión de los componentes de Hadoop, Instalación de los componentes de Hadoop junto con los servicios de MapR.
  • Almacenamiento de datos en el clúster, incluyendo a través de NFS y la administración de servicios & nodos.
  • Administrar datos utilizando volúmenes, gestionando usuarios y grupos, asignando roles a los nodos, comisionado y descomisionado de nodos, administración del clúster y monitoreo de rendimiento, configuración/ análisis y monitoreo de métricas para supervisar el rendimiento, configuración y administración de la seguridad de MapR.
  • Comprender y trabajar con M7 - almacenamiento nativo para las tablas de MapR.
  • Configuración y ajuste del clúster para un rendimiento óptimo.

Actualización del clúster e integración con otras configuraciones:

  • Actualizar la versión del software de MapR y tipos de actualización.
  • Configurar el clúster de Mapr para acceder al clúster HDFS.
  • Configuración del clúster de MapR en Amazon Elastic Mapreduce.

Todos los temas anteriores incluyen demostraciones y sesiones prácticas para que los aprendices tengan una experiencia práctica con la tecnología.

Requerimientos

  • Conocimientos básicos de Linux FS
  • Conocimientos básicos de Java
  • Conocimiento de la administración de Apache en MapR (recomendado)
 28 Horas

Número de participantes


Precio por Participante​

Testimonios (1)

Próximos cursos

Categorías Relacionadas