PRESENTADO POR

Senior Data Engineer

Speaker Title

Speaker Title

Según Gartner, para el 2022 más de un tercio de las empresas habrán implementado la virtualización de datos como su mejor aliado para la integración de datos. No te quedes atrás.
Durante esta demostración virtual de 1.5 horas, podrás descubrir de primera mano las capacidades de virtualización de datos en un entorno de Cloud.
¿QUÉ APRENDERÁS?
En este taller se mostrará como implementar paso a paso un caso de uso de analítica Big Data en un entorno Cloud usando la virtualización de datos. El instructor se conectará a un entorno en la nube AWS con los siguientes sistemas ya instalados y listos para usar:
- Amazon Redshift , el data warehouse en nube de AWS
- Amazon Aurora, la base de datos en nube basada en MySQL de AWS
- Cloudera Impala, sistema BigData de la empresa Cloudera
- Denodo Platform, el software para integración de datos en tiempo real de Denodo, que usa el enfoque de integración llamado Virtualización de Datos.
- Apache Zeppelin, uno de los sistemas de consulta y visualización de datos más populares en entornos de Data Science
El objetivo de la demostración será construir un informe para resolver una hipotética necesidad de negocio en una gran organización. Para ello será necesario combinar grandes volúmenes de datos distribuidos en Redshift, Aurora e Impala. Dichas fuentes tendrán ya precargados los conjuntos de datos necesarios, que en varios casos alcanzan los cientos de millones de tuplas. Se utilizará Denodo Data Virtualization para integrar y combinar los datos de los 3 sistemas subyacentes, y los resultados se visualizarán en un informe creado con Apache Zeppelin.
PERFIL DEL ALUMNADO
Es aconsejable que los alumnos tengan conocimientos básicos de SQL y bases de datos
Agenda
11:30 | Bienvenida
11:35 | Introducción a la Virtualización de Datos
11:50 | Introducción del entorno y casos de uso
12:00 | Demostración Práctica
13:00 | Cierre