Temario del curso
Introducción al Análisis de Datos y Big Data
- ¿Qué hace que los datos sean 'Grandes'?
- Velocidad, Volumen, Variedad, Veracidad (VVVV)
- Límites del Procesamiento Tradicional de Datos
- Procesamiento Distribuido
- Análisis Estadístico
- Tipos de Análisis de Aprendizaje Automático
- Visualización de Datos
Roles y Responsabilidades en Big Data
- Administradores
- Desarrolladores
- Analistas de Datos
Lenguajes Utilizados para el Análisis de Datos
- Lenguaje R
- ¿Por qué usar R para el Análisis de Datos?
- Manipulación de datos, cálculo y visualización gráfica
- Python
- ¿Por qué usar Python para el Análisis de Datos?
- Manipulación, procesamiento, limpieza y análisis de datos
Enfoques al Análisis de Datos
- Análisis Estadístico
- Análisis de Series Temporales
- Previsión con modelos de Correlación y Regresión
- Estadística Inferencial (estimación)
- Estadística Descriptiva en conjuntos de datos grandes (por ejemplo, cálculo de la media)
- Aprendizaje Automático
- Aprendizaje supervisado vs no supervisado
- Clasificación y agrupación
- Estimación del costo de métodos específicos
- Filtrado
- Procesamiento del Lenguaje Natural
- Procesamiento de texto
- Comprensión del significado del texto
- Generación automática de texto
- Análisis de sentimiento / análisis de temas
- Vision por Computadora
- Adquisición, procesamiento, análisis y comprensión de imágenes
- Reconstrucción, interpretación y comprensión de escenas 3D
- Uso de datos de imagen para tomar decisiones
Infraestructura de Big Data
- Almacenamiento de Datos
- Bases de datos relacionales (SQL)
- MySQL
- Postgres
- Oracle
- Bases de datos no relacionales (NoSQL)
- Cassandra
- MongoDB
- Neo4js
- Comprender las sutilezas
- Bases de datos jerárquicas
- Bases de datos orientadas a objetos
- Bases de datos orientadas a documentos
- Bases de datos orientadas a grafos
- Otras
- Bases de datos relacionales (SQL)
- Procesamiento Distribuido
- Hadoop
- HDFS como sistema de archivos distribuidos
- MapReduce para procesamiento distribuido
- Spark
- Marco de computación en clústeres en memoria para el procesamiento de grandes volúmenes de datos
- Streaming estructurado
- Spark SQL
- Bibliotecas de Aprendizaje Automático: MLlib
- Procesamiento de grafos con GraphX
- Hadoop
- Escalabilidad
- Nube pública
- AWS, Google, Aliyun, etc.
- Nube privada
- OpenStack, Cloud Foundry, etc.
- Escala automática
- Nube pública
Elegir la Solución Correcta para el Problema
El Futuro de Big Data
Resumen y Próximos Pasos
Requerimientos
- Una comprensión general de matemáticas
- Una comprensión general de programación
- Una comprensión general de bases de datos
Público Objetivo
- Desarrolladores / programadores
- Consultores de TI
Testimonios (7)
Cómo funciona el big data, programas de datos, mayor conocimiento de cómo funciona nuestro mundo actual utilizando datos
Ozayr Hussain - Vodacom
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
El lado práctico de la formación.
Patrick - Vodacom PTy Ltd
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Tópicos interactivos y el estilo utilizado por la ponencia para simplificar los temas para los estudiantes
Miran Saeed - Sulaymaniyah Asayish Agency
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
el entrenador y su capacidad para dar conferencias
ibrahim hamakarim - Sulaymaniyah Asayish Agency
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Ejercicios prácticos
JOEL CHIGADA - University of the Western Cape
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Programación en R
Osden Jokonya - University of the Western Cape
Curso - A Practical Introduction to Data Analysis and Big Data
Traducción Automática
Overall the Content was good.
Sameer Rohadia
Curso - A practical introduction to Data Analysis and Big Data
Traducción Automática