Curso de Data Science with KNIME Analytics Platform
KNIME La Plataforma de Analytics es una opción de código abierto líder para la innovación basada en datos, ayudando a descubrir el potencial oculto en sus datos, minas para nuevas perspectivas, o predecir nuevos futuros. Con más de 1000 módulos, cientos de ejemplos listos, una amplia gama de herramientas integradas, y la más amplia selección de algoritmos avanzados disponibles, KNIME Analytics Platform es la botella de herramientas perfecta para cualquier científico de datos y analista de negocios.
Este curso para KNIME Plataforma de Analytics es una oportunidad ideal para principiantes, usuarios avanzados y KNIME expertos para ser introducidos a KNIME, para aprender cómo utilizarlo de manera más eficaz, y cómo crear informes claros y completos basados en KNIME flujos de trabajo.
Este entrenamiento guiado por instructores, en vivo (online o on-site) está dirigido a profesionales de datos que desean utilizar KNIME para resolver las necesidades empresariales complejas.
Está dirigido al público que no sabe la programación y tiene la intención de utilizar herramientas avanzadas para implementar escenarios de análisis.
Al final de este curso, los participantes podrán:
- Instalar y configurar KNIME.
- Construcción Data Science escenarios
- Tren, pruebas y modelos validados
- La implementación termina con la cadena de valor final de los modelos de la ciencia de los datos
Formato del curso
- Lecciones y discusiones interactivas.
- Muchos ejercicios y prácticas.
- Implementación de manos en un entorno de laboratorio en vivo.
Opciones de Customización de Curso
- Para solicitar una formación personalizada para este curso o para saber más sobre este programa, por favor contacte con nosotros para organizar.
Certificado
Programa del Curso
Día 1:
Módulo 1: KNIME Plataforma de análisis: Descripción general
- Instalación
- Inicio y personalización KNIME de la plataforma de análisis
- Nodos, datos y flujos de trabajo
- El ciclo de la ciencia de datos
Módulo 2: Datos Access
- Leer datos del archivo
- Accessing Servicios REST
Módulo 3: ETL y manipulación de datos
- Filtrado de filas y columnas
- Agregadores
- Unir y concatenar
- Transformación: conversión, reemplazo, estandarización y generación de nuevas características
- Preparación de datos para el análisis de series temporales
Día 2:
Módulo 4: Exportación de datos
- Escribir en un archivo
- Generación de un informe
Módulo 5: Data Visualization
- Exploración visual univariante interactiva
- Exploración visual multivariante interactiva
- Funciones avanzadas de visualización
Módulo 6: Predictive Analytics Uso de KNIME
- Data Mining Conceptos básicos
- Regresiones
- Árbol genealógico del árbol de decisiones
- Evaluación del modelo
Día 3:
Módulo 7: Control del flujo
- Parametrización del flujo de trabajo: variables de flujo
- Volver a ejecutar partes de flujo de trabajo: bucles
- Limpieza del flujo de trabajo
Módulo 8: Práctica KNIME Estudio de caso basado en una plataforma de análisis
Requerimientos
Recomendado
- Una comprensión básica de cómo dar sentido a los datos.
- Experiencia en el procesamiento de datos fundamentales.
Audiencia
- Analistas de datos
- Científicos de datos
- Analistas de Negocios
Los cursos de formación abiertos requieren más de 5 participantes.
Curso de Data Science with KNIME Analytics Platform - Booking
Curso de Data Science with KNIME Analytics Platform - Enquiry
Data Science with KNIME Analytics Platform - Consultas
Consultas
Testimonios (5)
Comprender mejor los datos masivos
Shaune Dennis - Vodacom
Curso - Big Data Business Intelligence for Telecom and Communication Service Providers
Traducción Automática
Aprendizaje automático, python, manipulación de datos
Siphelo Mapolisa - University Of South Africa
Curso - Data Science: Analysis and Presentation
Traducción Automática
Es genial que el curso esté diseñado específicamente para las áreas clave que he resaltado en el cuestionario previo al curso. Esto realmente ayuda a abordar las preguntas que tengo sobre el tema y a alinearse con mis objetivos de aprendizaje.
Winnie Chan - Statistics Canada
Curso - Jupyter for Data Science Teams
Traducción Automática
La capacitacidad de la herramienta
Gerardo Avila - Reckitt Benckizer
Curso - KNIME Analytics Platform for BI
The example and training material were sufficient and made it easy to understand what you are doing.
Teboho Makenete
Curso - Data Science for Big Data Analytics
Traducción Automática
Próximos cursos
Cursos Relacionados
Anaconda Ecosystem for Data Scientists
14 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) está dirigida a científicos de datos que desean utilizar el ecosistema Anaconda para capturar, administrar e implementar paquetes y flujos de trabajo de análisis de datos en una sola plataforma.
Al final de esta formación, los participantes serán capaces de:
- Instale y configure Anaconda componentes y bibliotecas.
- Comprender los conceptos básicos, las características y los beneficios de Anaconda.
- Administre paquetes, entornos y canales con Anaconda Navigator.
- Utilice los paquetes Conda, R y Python para la ciencia de datos y el aprendizaje automático.
- Conozca algunos casos de uso prácticos y técnicas para la gestión de múltiples entornos de datos.
Inteligencia de Negocios Big Data para Proveedores de Servicios de Comunicaciones y Telecomunicaciones
35 HorasVisión general
Los proveedores de servicios (CSP) se enfrentan a la presión de reducir los costes y maximizar los ingresos medios por usuario (ARPU), al tiempo que garantizan una excelente experiencia al cliente, pero los volúmenes de datos siguen creciendo. El tráfico global de datos móviles crecerá a una tasa de crecimiento anual compuesta (CAGR) del 78 por ciento hasta 2016, alcanzando los 10,8 exabytes por mes.
Mientras tanto, los CSP están generando grandes volúmenes de datos, incluidos los registros detallados de llamadas (CDR), los datos de red y los datos de los clientes. Las empresas que explotan al máximo estos datos obtienen una ventaja competitiva. Según una encuesta reciente de The Economist Intelligence Unit, las empresas que utilizan la toma de decisiones dirigida por datos disfrutan de un aumento del 5-6% en la productividad. Sin embargo, el 53% de las empresas aprovechan solo la mitad de sus valiosos datos, y una cuarta parte de los encuestados señaló que grandes cantidades de datos útiles no se explotan. Los volúmenes de datos son tan altos que el análisis manual es imposible, y la mayoría de los sistemas de software heredados no pueden seguir el ritmo, lo que hace que los datos valiosos se descarten o se ignoren.
Con el software de big data escalable y de alta velocidad de Big Data & Analytics, los CSP pueden extraer todos sus datos para una mejor toma de decisiones en menos tiempo. Los diferentes productos y técnicas de Big Data proporcionan una plataforma de software de extremo a extremo para recopilar, preparar, analizar y presentar información a partir de Big Data. Las áreas de aplicación incluyen el monitoreo del rendimiento de la red, la detección de fraudes, la detección de pérdida de clientes y el análisis de riesgo crediticio. Los productos de Big Data y Analytics se escalan para manejar terabytes de datos, pero la implementación de tales herramientas necesita un nuevo tipo de sistema de base de datos basado en la nube como Hadoop o un procesador de computación paralela a escala masiva (KPU, etc.)
Este curso sobre Big Data BI para telecomunicaciones cubre todas las nuevas áreas emergentes en las que los CSP están invirtiendo para aumentar la productividad y abrir nuevas fuentes de ingresos comerciales. El curso proporcionará una visión completa de 360 grados de Big Data BI en Telco para que los responsables de la toma de decisiones y los gerentes puedan tener una visión general muy amplia y completa de las posibilidades de Big Data BI en Telco para la productividad y el aumento de ingresos.
Objetivos del curso
El objetivo principal del curso es introducir nuevas técnicas de inteligencia de negocio Big Data en 4 sectores de Telecom Negocio (Marketing/Ventas, Operación de Red, Operación Financiera y Gestión de Relaciones con el Cliente). A los estudiantes se les presentará lo siguiente:
- Introducción al Big Data: qué son las 4V (volumen, velocidad, variedad y veracidad) en Big Data: generación, extracción y gestión desde la perspectiva de las telecomunicaciones
- En qué se diferencia el análisis de Big Data del análisis de datos heredado
- Justificación interna de la perspectiva Big Data -Telco
- Introducción al ecosistema de Hadoop: familiaridad con todas las herramientas de Hadoop como Hive, Pig, SPARC: cuándo y cómo se utilizan para resolver problemas de Big Data.
- Cómo se extrae Big Data para analizarlo para la herramienta de análisis: cómo los análisis de negocios pueden reducir sus puntos débiles de recopilación y análisis de datos a través del enfoque integrado del panel de control de Hadoop
- Introducción básica de la analítica de Insight, la analítica de visualización y la analítica predictiva para las empresas de telecomunicaciones
- Análisis de pérdida de clientes y Big Data: cómo el análisis de Big Data puede reducir la pérdida de clientes y la insatisfacción de los clientes en los estudios de casos de telecomunicaciones
- Análisis de fallos de red y fallos de servicio a partir de metadatos de red e IPDR
- Análisis financiero: estimación de fraude, desperdicio y ROI a partir de datos operativos y de ventas
- Problema de adquisición de clientes: marketing objetivo, segmentación de clientes y venta cruzada a partir de datos de ventas
- Introducción y resumen de todos los productos analíticos de Big Data y dónde encajan en el espacio analítico de las telecomunicaciones
- Conclusión: cómo adoptar un enfoque paso a paso para introducir Big Data Business Intelligence en su organización
Público objetivo
- Operación de redes, gerentes financieros, gerentes de CRM y altos gerentes de TI en la oficina de CIO de telecomunicaciones.
- Business Analistas de telecomunicaciones
- Gerentes/analistas de la oficina del CFO
- Gerentes de operaciones
- Gerentes de control de calidad
Data Science Programme
245 HorasLa explosión de información y datos en el mundo actual no tiene paralelo, nuestra capacidad para innovar y ampliar los límites de lo posible está creciendo más rápido que nunca. El rol de científico de datos es una de las habilidades más demandadas en la industria actual.
Ofrecemos mucho más que aprender a través de la teoría; brindamos habilidades prácticas y comercializables que cierran la brecha entre el mundo académico y las demandas de la industria.
Este plan de estudios de 7 semanas se puede adaptar a los requisitos específicos de su industria, contáctenos para obtener más información o visite el sitio web del Instituto Nobleprog
Audiencia:
Este programa está dirigido a graduados de posgrado, así como a cualquier persona con los requisitos previos requeridos que se determinarán mediante una evaluación y una entrevista.
Entrega:
La entrega del curso será una mezcla de Instructor Ded Classroom y Instructor Led Online; por lo general, la primera semana será 'aula dirigida', las semanas 2 a 6 'aula virtual' y la semana 7 de vuelta a 'aula dirigida'.
Ciencia de Datos para Big Data Analytics
35 HorasBig data son conjuntos de datos que son tan voluminosos y complejos que el software de aplicación de procesamiento de datos tradicional es inadecuado para manejarlos. Los grandes desafíos de datos incluyen la captura de datos, el almacenamiento de datos, el análisis de datos, la búsqueda, el intercambio, la transferencia, la visualización, la consulta, la actualización y la privacidad de la información.
Data Science essential for para los profesionales de marketing / ventas
21 HorasEste curso está dirigido a Marketing profesionales de ventas que tienen la intención de profundizar en la aplicación de la ciencia de datos en Marketing/ Ventas. El curso proporciona Cobertura detallada de las diferentes técnicas de ciencia de datos utilizadas para "upsale", "cross-sale", segmentación de mercado, branding y CLV.
Diferencia de Marketing y Ventas: ¿en qué se diferencian las ventas y el marketing?
En palabras muy simples, las ventas se pueden denominar como un proceso que se enfoca o se dirige a individuos o grupos pequeños. Marketing Por otro lado, se dirige a un grupo más grande o al público en general. Marketing incluye la investigación (identificación de las necesidades del cliente), el desarrollo de productos (producción de productos innovadores) y la promoción del producto (a través de anuncios) y la creación de conciencia sobre el producto entre los consumidores. Como tal, el marketing significa generar clientes potenciales o prospectos. Una vez que el producto está en el mercado, es tarea del vendedor persuadir al cliente para que compre el producto. Las ventas significan convertir los clientes potenciales o potenciales en compras y pedidos, mientras que el marketing está dirigido a plazos más largos, las ventas pertenecen a objetivos más cortos.
Jupyter para Equipos de Ciencia de Datos
7 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) presenta la idea del desarrollo colaborativo en ciencia de datos y demuestra cómo usar Jupyter para rastrear y participar como equipo en el "ciclo de vida de una idea computacional". Guía a los participantes a través de la creación de un proyecto de ciencia de datos de muestra basado en el ecosistema de Jupyter.
Al final de esta formación, los participantes serán capaces de:
- Instale y configure Jupyter, incluida la creación e integración de un repositorio de equipo en Git.
- Utilice las funciones de Jupyter, como extensiones, widgets interactivos, modo multiusuario, etc., para habilitar la colaboración en proyectos.
- Cree, comparta y organice Jupyter Notebooks con los miembros del equipo.
- Elija entre Scala, Python, R, para escribir y ejecutar código en sistemas de big data como Apache Spark, todo a través de la interfaz de Jupyter.
Kaggle
14 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean aprender y desarrollar sus carreras en Data Science utilizando Kaggle.
Al final de esta formación, los participantes serán capaces de:
- Más información sobre la ciencia de datos y el aprendizaje automático.
- Explora el análisis de datos.
- Obtenga más información sobre Kaggle y cómo funciona.
KNIME Analytics Platform for BI
21 HorasKNIME Analytics Platform es una opción líder de código abierto para la innovación basada en datos, que le ayuda a descubrir el potencial oculto en sus datos, extraer información fresca o predecir nuevos futuros. Con más de 1000 módulos, cientos de ejemplos listos para ejecutar, una amplia gama de herramientas integradas y la más amplia selección de algoritmos avanzados disponibles, KNIME Analytics Platform es la caja de herramientas perfecta para cualquier científico de datos y analista de negocios.
Este curso para KNIME Analytics Platform es una oportunidad ideal para que los principiantes, los usuarios avanzados y los KNIME expertos conozcan KNIME, aprendan a utilizarlo de forma más eficaz y a crear informes claros y completos basados en KNIME flujos de trabajo
Platforma analityczna KNIME - szkolenie kompleksowe
35 HorasEl curso de formación "Analytics Platform KNIME" ofrece una visión completa de esta plataforma gratuita de análisis de datos. El programa incluye una introducción al procesamiento y análisis de datos, instalación y configuración KNIME, creación de flujos de trabajo, metodología para la creación de modelos de negocio y modelado de datos. El curso también analiza herramientas avanzadas de análisis de datos, importación y exportación de flujos de trabajo, integración de herramientas, procesos ETL, minería de datos, visualización, extensiones e integraciones con herramientas como R, Java, Python, Gephi, Neo4j. La conclusión incluye una visión general de la presentación de informes, la integración con BIRT y KNIME WebPortal.
KNIME with Python and R for Machine Learning
14 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) está dirigida a científicos de datos que desean programar en Python y R para KNIME.
Al final de esta formación, los participantes serán capaces de:
- Planifique, cree e implemente modelos de aprendizaje automático en KNIME.
- Tome decisiones basadas en datos para las operaciones.
- Implementar proyectos de ciencia de datos de extremo a extremo.
Fundamentos de MATLAB, Ciencia de datos y generación de informes
35 HorasEn la primera parte de esta capacitación, cubrimos los fundamentos de MATLAB y su función como lenguaje y plataforma. En esta discusión se incluye una introducción a MATLAB la sintaxis, matrices y matrices, la visualización de datos, el desarrollo de scripts y los principios orientados a objetos.
En la segunda parte, demostramos cómo usar MATLAB para la minería de datos, el aprendizaje automático y el análisis predictivo. Para proporcionar a los participantes una perspectiva clara y práctica del enfoque y el poder de MATLAB, establecemos comparaciones entre el uso de MATLAB y el uso de otras herramientas como hojas de cálculo, C, C++ y Visual Basic.
En la tercera parte de la formación, los participantes aprenden a agilizar su trabajo automatizando el procesamiento de datos y la generación de informes.
A lo largo del curso, los participantes pondrán en práctica las ideas aprendidas a través de ejercicios prácticos en un entorno de laboratorio. Al final de la capacitación, los participantes tendrán una comprensión profunda de las capacidades de MATLAB y podrán emplearlas para resolver problemas de ciencia de datos del mundo real, así como para optimizar su trabajo a través de la automatización.
Se llevarán a cabo evaluaciones a lo largo del curso para medir el progreso.
Formato del curso
- El curso incluye ejercicios teóricos y prácticos, que incluyen discusiones de casos, inspección de código de muestra e implementación práctica.
Nota
- Las sesiones de práctica se basarán en plantillas de informes de datos de muestra preestablecidas. Si tiene requisitos específicos, póngase en contacto con nosotros para organizarlo.
Accelerating Python Pandas Workflows with Modin
14 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean usar Modin para crear e implementar cálculos paralelos con Pandas para un análisis de datos más rápido.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno necesario para comenzar a desarrollar Pandas flujos de trabajo a escala con Modin.
- Comprender las características, la arquitectura y las ventajas de Modin.
- Conoce las diferencias entre Modin, Dask y Ray.
- Realice Pandas operaciones más rápido con Modin.
- Implemente toda la API Pandas y las funciones.
Programación Python para Finanzas
35 HorasPython es un lenguaje de programación que ha ganado gran popularidad en la industria financiera. Utilizado por los mayores bancos de inversión y fondos de cobertura, se está empleando para construir una amplia gama de aplicaciones financieras que van desde los principales programas de negociación hasta los sistemas de gestión de riesgos.
En esta capacitación en vivo dirigida por un instructor, los participantes aprenderán cómo usar Python para desarrollar aplicaciones prácticas para resolver una serie de problemas específicos relacionados con las finanzas.
Al final de esta capacitación, los participantes podrán:
- Comprender los fundamentos del lenguaje de programación Python
- Descargar, instalar y mantener las mejores herramientas de desarrollo para crear aplicaciones financieras en Python
- Seleccionar y utilizar los paquetes y técnicas de programación más adecuados de Python para organizar, visualizar y analizar datos financieros de diversas fuentes (CSV, Excel, bases de datos, web, etc.)
- Construir aplicaciones que resuelvan problemas relacionados con la asignación de activos, el análisis de riesgos, el rendimiento de las inversiones y más
- Solucionar problemas, integrar, implementar y optimizar una aplicación en Python
Audiencia
- Desarrolladores
- Analistas
- Quants
Formato del curso
- Parte teórica, parte discusión, ejercicios y práctica intensiva
Nota
- Esta capacitación tiene como objetivo proporcionar soluciones para algunos de los principales problemas que enfrentan los profesionales de las finanzas. Sin embargo, si tiene un tema, herramienta o técnica en particular que desee agregar o ampliar, por favor contáctenos para organizarlo.
GPU Data Science with NVIDIA RAPIDS
14 HorasEsta capacitación en vivo dirigida por un instructor en Guatemala (en línea o presencial) está dirigida a científicos de datos y desarrolladores que desean usar RAPIDS para crear canalizaciones, flujos de trabajo y visualizaciones de datos acelerados GPU, aplicando algoritmos de aprendizaje automático, como XGBoost, cuML etcetera.
Al final de esta formación, los participantes serán capaces de:
- Configure el entorno de desarrollo necesario para crear modelos de datos con NVIDIA RAPIDS.
- Comprenda las características, componentes y ventajas de RAPIDS.
- Aproveche GPUs para acelerar las canalizaciones de datos y análisis de extremo a extremo.
- Implemente la preparación de datos acelerada GPU y ETL con cuDF y Apache Arrow.
- Aprenda a realizar tareas de aprendizaje automático con los algoritmos XGBoost y cuML.
- Cree visualizaciones de datos y ejecute análisis de gráficos con cuXfilter y cuGraph.
Ciencia de Datos: Análisis y Presentación
7 HorasEl entorno integrado del sistema Wolfram lo convierte en una herramienta eficiente tanto para analizar como para presentar datos. Este curso cubre aspectos del Wolfram Lenguaje relevantes para la analítica, incluido el cálculo estadístico, la visualización, la importación y exportación de datos y la generación automática de informes.