Temario del curso

Introducción al Análisis de Datos y Big Data

  • ¿Qué hace que los datos sean 'Grandes'?
    • Velocidad, Volumen, Variedad, Veracidad (VVVV)
  • Límites del Procesamiento Tradicional de Datos
  • Procesamiento Distribuido
  • Análisis Estadístico
  • Tipos de Análisis de Aprendizaje Automático
  • Visualización de Datos

Roles y Responsabilidades en Big Data

  • Administradores
  • Desarrolladores
  • Analistas de Datos

Lenguajes Utilizados para el Análisis de Datos

  • Lenguaje R
    • ¿Por qué usar R para el Análisis de Datos?
    • Manipulación de datos, cálculo y visualización gráfica
  • Python
    • ¿Por qué usar Python para el Análisis de Datos?
    • Manipulación, procesamiento, limpieza y análisis de datos

Enfoques al Análisis de Datos

  • Análisis Estadístico
    • Análisis de Series Temporales
    • Previsión con modelos de Correlación y Regresión
    • Estadística Inferencial (estimación)
    • Estadística Descriptiva en conjuntos de datos grandes (por ejemplo, cálculo de la media)
  • Aprendizaje Automático
    • Aprendizaje supervisado vs no supervisado
    • Clasificación y agrupación
    • Estimación del costo de métodos específicos
    • Filtrado
  • Procesamiento del Lenguaje Natural
    • Procesamiento de texto
    • Comprensión del significado del texto
    • Generación automática de texto
    • Análisis de sentimiento / análisis de temas
  • Vision por Computadora
    • Adquisición, procesamiento, análisis y comprensión de imágenes
    • Reconstrucción, interpretación y comprensión de escenas 3D
    • Uso de datos de imagen para tomar decisiones

Infraestructura de Big Data

  • Almacenamiento de Datos
    • Bases de datos relacionales (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Bases de datos no relacionales (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • Comprender las sutilezas
      • Bases de datos jerárquicas
      • Bases de datos orientadas a objetos
      • Bases de datos orientadas a documentos
      • Bases de datos orientadas a grafos
      • Otras
  • Procesamiento Distribuido
    • Hadoop
      • HDFS como sistema de archivos distribuidos
      • MapReduce para procesamiento distribuido
    • Spark
      • Marco de computación en clústeres en memoria para el procesamiento de grandes volúmenes de datos
      • Streaming estructurado
      • Spark SQL
      • Bibliotecas de Aprendizaje Automático: MLlib
      • Procesamiento de grafos con GraphX
  • Escalabilidad
    • Nube pública
      • AWS, Google, Aliyun, etc.
    • Nube privada
      • OpenStack, Cloud Foundry, etc.
    • Escala automática

Elegir la Solución Correcta para el Problema

El Futuro de Big Data

Resumen y Próximos Pasos

Requerimientos

  • Una comprensión general de matemáticas
  • Una comprensión general de programación
  • Una comprensión general de bases de datos

Público Objetivo

  • Desarrolladores / programadores
  • Consultores de TI
 35 Horas

Número de participantes


Precio por Participante​

Testimonios (7)

Próximos cursos

Categorías Relacionadas