Tutorial Talend Open Studio. # 3 Metadata

Repository: Metadata
Como continuación del tutorial anterior y avanzando en las opciones de la vista repositorio. El nodo «Metadata» nos permite gestionar conexiones, configuraciones y esquemas para extraer datos de diferentes orígenes para poder ser utilizados en múltiples componentes de un mismo job o diferentes jobs dentro de nuestro proyecto ahorrando tiempo y esfuerzos mediante la reutilización de tareas.
Conexiones a bases de datos
Empezamos creando una conexión a una base de datos desde el nodo «Db Connections» de la vista repository, botón derecho y clic en «Create connection»
Se nos abre una pantalla de creación, que ya nos empieza a resultar familiar, pues es idéntica a la que hemos estado viendo en la creación de otros elementos del repositorio como «Documents» y «Business Model». Una vez completado el «name», «purpose», «description» y «version» que queramos dar a la conexión, pulsamos «Next» y se nos abre una nueva pantalla de configuración de la conexión que debemos configurar.
Lo primero es seleccionar el tipo de base de datos que queremos conectarnos (En nuestro ejemplo MySQL) y también la versión de nuestro servidor de base de datos.
En server indicamos el host o IP en donde está la base de datos y finalmente entramos en login el usuario de la base de datos.
En port si no se ha modificado en principio mantenemos el que propone por defecto (en MySQL es el 3306) y finalmente mediante un clic en test para comprobar que la conexión se establece correctamente.
Esquema de Talend
Perfecto ya tenemos conexión.. ¿Que más cosas podemos hacer?
Lo primero conseguir los diferentes esquemas que podemos necesitar para nuestro desarrollo.
Antes de seguir avanzando hace falta explicar que es un esquema «schema» de Talend y para que sirve:
¿ Qué es un esquema «Schema» en Talend?
Un esquema en Talend es el que determina la estructura de datos que tienen las tablas de datos o datasets, concretando la estructura de campos y tipo de datos»data type» de las tablas de orígenes de datos que vamos a utilizar en nuestros desarrollos de jobs.
Es importante indicar que siempre necesitamos establecer de manera obligatoria un esquema de datos en todos los componentes de imput de datos.
Extraer esquema de una base de datos
Podemos extraer los esquemas de las tablas de una base de datos de manera asistida. La manera de hacerlo es clicando el botón derecho sobre nuestra conexión y elegimos la opción » Retrieve Schema».
Seleccionamos el tipo de objeto de la base de datos (tablas o vistas) y mediante filtro con comodín % nos puede ayudar a buscar e identificar las tablas que queremos extraer los esquemas.
Seleccionamos las tablas del catálogo que necesitemos trabajar y finalmente «Finish».
Con los esquemas ya extraídos, Talend funciona como un completo cliente de la base de datos, desde el cual podemos generar querys y guardarlas en el repositorio para ser usadas en diferentes componentes de imput de datos.
Generar Query
En la conexión botón derecho y seleccionamos «Edit Query» en donde podemos consutar los contenidos de las tablas y probar y guardar querys en el repositorio para ser reutilizadas en nuestros jobs en los componentes de imputs de tablas de bases de datos.
Antoni Lisbona: Director de BuConDa
Hola.
estoy construyendo una conexion hacia una base de datos oracle 10i. Al momento de extraer el esquema, el asistente no me muestra las tablas que hacen parte de este. Hay alguna forma alternativa de obtener el esquema de las tablas. Gracias
Hola Aldo necesitaría algun dato más para responder. Entiendo que la conexión la has testeado y te da un OK conforme la conexión se ha establecido y que el usuario que usas tiene privilegios suficientes en la base de datos. Si me haces llegar más datos y los pantallazos de la configuración de la metadata a buconda@buconda.com nos lo miramos.
Saludos