Gracias por enviar su consulta! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Gracias por enviar su reserva! Uno de los miembros de nuestro equipo se pondrá en contacto con usted en breve.
Programa del Curso
Big Data Resumen:
- ¿Qué es Big Data?
- Por qué Big Data está ganando popularidad
- Estudios de casos de Big Data
- Características de Big Data
- Soluciones para trabajar con Big Data.
Hadoop y sus componentes:
- ¿Qué es Hadoop y cuáles son sus componentes?
- Arquitectura de Hadoop y las características de los datos que puede manejar/procesar.
- Breve historia de Hadoop, empresas que lo usan y por qué comenzaron a usarlo.
- Marco de trabajo de Hadoop y sus componentes - explicados en detalle.
- ¿Qué es HDFS y lecturas-escrituras al Sistema de Archivos Distribuido de Hadoop?
- Cómo configurar un clúster de Hadoop en diferentes modos - Stand-alone/Pseudo/Multi Node cluster.
(Esto incluye la configuración de un clúster de Hadoop en VirtualBox/KVM/VMware, las configuraciones de red que deben ser revisadas cuidadosamente, ejecutar demonios de Hadoop y probar el clúster).
- ¿Qué es el marco de trabajo Map Reduce y cómo funciona?
- Ejecutando trabajos de Map Reduce en un clúster de Hadoop.
- Comprender replicación, espejado y conciencia de rack en el contexto de los clústers de Hadoop.
Planificación del Clúster de Hadoop:
- Cómo planificar tu clúster de hadoop.
- Comprender hardware-software para planificar tu clúster de hadoop.
- Entender los trabajos y planear el clúster para evitar fallos y rendimiento óptimo.
¿Qué es MapR y por qué MapR?
- Resumen de MapR y su arquitectura.
- Comprender y trabajar con el Sistema de Control de MapR, Volúmenes de MapR, instantáneas y espejos.
- Planificar un clúster en el contexto de MapR.
- Comparación de MapR con otras distribuciones y Apache Hadoop.
- Instalación y despliegue del clúster de MapR.
Configuración e administración del clúster:
- Administrar servicios, nodos, instantáneas, volúmenes espejos y clusters remotos.
- Comprender y administrar Nodos.
- Comprensión de los componentes de Hadoop, Instalación de los componentes de Hadoop junto con los servicios de MapR.
- Almacenamiento de datos en el clúster, incluyendo a través de NFS y la administración de servicios & nodos.
- Administrar datos utilizando volúmenes, gestionando usuarios y grupos, asignando roles a los nodos, comisionado y descomisionado de nodos, administración del clúster y monitoreo de rendimiento, configuración/ análisis y monitoreo de métricas para supervisar el rendimiento, configuración y administración de la seguridad de MapR.
- Comprender y trabajar con M7 - almacenamiento nativo para las tablas de MapR.
- Configuración y ajuste del clúster para un rendimiento óptimo.
Actualización del clúster e integración con otras configuraciones:
- Actualizar la versión del software de MapR y tipos de actualización.
- Configurar el clúster de Mapr para acceder al clúster HDFS.
- Configuración del clúster de MapR en Amazon Elastic Mapreduce.
Todos los temas anteriores incluyen demostraciones y sesiones prácticas para que los aprendices tengan una experiencia práctica con la tecnología.
Requerimientos
- Conocimientos básicos de Linux FS
- Conocimientos básicos de Java
- Conocimiento de la administración de Apache en MapR (recomendado)
28 Horas
Testimonios (1)
cosas prácticas de hacer, también teoría fue bien servida por Ajay
Dominik Mazur - Capgemini Polska Sp. z o.o.
Curso - Hadoop Administration on MapR
Traducción Automática