Logo Talend

Tutorial Talend Open Studio. # 3 Metadata

Menu Metatadata
Imagen del repositorio del apartado de metadata de conexiones a bases de datos

Repository: Metadata

Como continuación del tutorial anterior y avanzando en las opciones de la vista repositorio. El nodo «Metadata» nos permite gestionar conexiones, configuraciones y esquemas para extraer datos de diferentes orígenes para poder ser utilizados en múltiples componentes de un mismo job o diferentes jobs dentro de nuestro proyecto ahorrando tiempo y esfuerzos mediante la reutilización de tareas.

 

Conexiones  a bases de datos

Empezamos creando una conexión a una base de datos desde el nodo  «Db Connections» de la vista repository, botón derecho y clic en «Create connection» 
Creación conexión

Se nos abre una pantalla de creación, que ya nos empieza a resultar familiar, pues es idéntica a la que hemos estado viendo en la creación de otros elementos del repositorio como «Documents» y «Business Model». Una vez completado el «name», «purpose», «description» y «version» que queramos dar a la conexión, pulsamos «Next» y se nos abre una nueva pantalla de configuración de la conexión que debemos configurar.

Lo primero es seleccionar el tipo de base de datos que queremos conectarnos (En nuestro ejemplo MySQL) y también la versión de nuestro servidor de base de datos.

En server indicamos el host o IP en donde está la base de datos y finalmente entramos en login el usuario de la base de datos.

En port si no se ha modificado en principio mantenemos el que propone por defecto (en MySQL es el 3306) y finalmente mediante un clic en test para comprobar que la conexión se establece correctamente.

Esquema de Talend

Conexión BD

Perfecto ya tenemos conexión.. ¿Que más cosas podemos hacer? 

Lo primero conseguir los diferentes esquemas  que podemos necesitar para nuestro desarrollo.

Antes de seguir avanzando hace falta explicar que es un esquema «schema» de Talend y para que sirve:

 

¿ Qué es un esquema «Schema» en Talend?

Un esquema en Talend es el que determina la estructura de datos que tienen las tablas de datos o datasets, concretando la estructura de  campos y tipo de datos»data type» de las tablas de orígenes de datos que vamos a utilizar en nuestros desarrollos de jobs.
Es importante indicar que siempre necesitamos establecer de manera obligatoria un esquema de datos en todos los componentes de imput de datos. 

Extraer esquema de una base de datos

Podemos extraer los esquemas de las tablas de una base de datos de manera asistida. La manera de hacerlo es clicando el botón derecho sobre nuestra conexión y  elegimos la opción » Retrieve Schema».

Seleccionamos el tipo de objeto de la base de datos (tablas o vistas) y mediante  filtro con comodín % nos puede ayudar a buscar e identificar las tablas que queremos extraer los esquemas.

 

Extraer esquema
Selección del esquema a importar

Seleccionamos las tablas del catálogo que necesitemos trabajar y finalmente  «Finish».

Con los esquemas ya extraídos, Talend funciona como un completo cliente de la base de datos, desde el cual podemos generar  querys y guardarlas en el repositorio para ser usadas en diferentes componentes de imput de datos.

Generar Query

En la conexión botón derecho y seleccionamos «Edit Query» en donde podemos consutar los contenidos de las tablas y probar y guardar querys en el repositorio para ser reutilizadas en nuestros jobs en los componentes de  imputs de tablas de bases de datos.

 

Ejemplo query

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *