Analítica Big Data en entornos Cloud usando Virtualización de Datos

PRESENTADO POR

Guillermo Sandino
Senior Data Engineer

Speaker Name
Speaker Title

Según Gartner, para el 2022 más de un tercio de las empresas habrán implementado la virtualización de datos como su mejor aliado para la integración de datos. No te quedes atrás.

Durante esta demostración virtual de 1.5 horas, podrás descubrir de primera mano las capacidades de virtualización de datos en un entorno de Cloud.

¿QUÉ APRENDERÁS?

En este taller se mostrará como implementar paso a paso un caso de uso de analítica Big Data en un entorno Cloud usando la virtualización de datos. El instructor se conectará a un entorno en la nube AWS con los siguientes sistemas ya instalados y listos para usar:

Amazon Redshift , el data warehouse en nube de AWS
Amazon Aurora, la base de datos en nube basada en MySQL de AWS
Cloudera Impala, sistema BigData de la empresa Cloudera
Denodo Platform, el software para integración de datos en tiempo real de Denodo, que usa el enfoque de integración llamado Virtualización de Datos.
Apache Zeppelin, uno de los sistemas de consulta y visualización de datos más populares en entornos de Data Science

El objetivo de la demostración será construir un informe para resolver una hipotética necesidad de negocio en una gran organización. Para ello será necesario combinar grandes volúmenes de datos distribuidos en Redshift, Aurora e Impala. Dichas fuentes tendrán ya precargados los conjuntos de datos necesarios, que en varios casos alcanzan los cientos de millones de tuplas. Se utilizará Denodo Data Virtualization para integrar y combinar los datos de los 3 sistemas subyacentes, y los resultados se visualizarán en un informe creado con Apache Zeppelin.

PERFIL DEL ALUMNADO

Es aconsejable que los alumnos tengan conocimientos básicos de SQL y bases de datos

Agenda

11:30 | Bienvenida

11:35 | Introducción a la Virtualización de Datos

11:50 | Introducción del entorno y casos de uso

12:00 | Demostración Práctica

13:00 | Cierre

Agregar a calendario

Taller Práctico

Analítica Big Data en entornos Cloud usando Virtualización de Datos

Lunes 3 de mayo | 11:30 AM | Duración: 1.5 horas

PRESENTADO POR

Según Gartner, para el 2022 más de un tercio de las empresas habrán implementado la virtualización de datos como su mejor aliado para la integración de datos. No te quedes atrás.

¿QUÉ APRENDERÁS?

PERFIL DEL ALUMNADO

Agenda

Agenda