Configuración
Breadcrumbs

Tripletas

En Anjana Data, una tripleta es una etiqueta compuesta por tres partes que identifica un punto concreto dentro de una tecnología o plugin.

Ejemplo:

Virtualizador/Denodo/Territorio
  • Virtualizador → categoría general de la tecnología en la arquitectura de datos de la organización

  • Denodo → herramienta/tecnología concreta

  • Territorio → ámbito o dominio dentro de esa herramienta

La tripleta funciona como una dirección postal: indica dónde deben aplicarse las funcionalidades de Anjana Data (extracción de metadatos, sampleo, actualización de tags, gestión de permisos, etc.).

De esta forma, cada acción de la plataforma se combina con una tripleta para que Anjana Data sepa qué tiene que hacer y dónde debe hacerlo.

Diseño y definición de Tripletas

La activación de un plugin para extracción metadatos, sampleo de datos y/o gestión de permisos de acceso se basa en la definición y utilización de una tripleta.

Estas tripletas se componen de una terna formada por los metadatos de referencia (Attribute Definition Values) que adquieren los siguientes atributos (Attribute Definitions):

  • Infraestructura (infrastructure). Por ejemplo: “Azure”, “AWS”, “Virtualizador”, “DWH”, “Reporting”

  • Tecnología (technology). Por ejemplo: “Azure Storage, “Amazon S3”, “Denodo”, “Oracle”, “Tableau”

  • Zona (zone). Por ejemplo: “Silver”, “Gold”, “Territorio”

Las tripletas se caracterizan por lo siguiente:

  • Son 100% personalizables, cada organización puede establecer la lógica de las colecciones utilizando cualquier terna de valores de referencia para los atributos de infrastructure/technology/zone.

  • Cada tripleta debe ser única, es decir, las ternas no se pueden repetir en la configuración de más de un plugin.

  • Cada tripleta resuelve una conexión con una tecnología mediante unas credenciales que tiene permisos para extracción de metadatos, sampleo de datos y/o gestión de permisos de acceso entre otros. Esto se configura en el YAML de cada plugin.

image-20250916-145425.png

🔎 Ejemplo de tripleta para conectar con datos virtualizados en Denodo:

  • Tripleta: Virtualizador/Denodo/Territorio

  • Plugin: JDBC Denodo

  • Funciones habilitadas: extracción de metadatos, sampleo, gestión de permisos de acceso y gestión de tags.

  • Fragmento del YAML en el que se muestra como la tripleta resuelve una única conexión y habilita variedad de funcionalidades:

    • La ari es la propiedad del YAML que permite vincular la tripleta con las funcionalidades del plugin (updateTags, sample, extract…)

    • La ari debe estar configurada con los valores configurados en el campo name de Attribute Definition Values, no con los valores de traducción (value de Translations)

        connection:
          - name: pro
            technology:
              driver: com.denodo.vdp.jdbc.Driver
              url: jdbc:vdb://entornodenodo.anjanadata.org:9999/poc?ssl=true
              user: 
              password: 
              imType: "LDAP"
              sampleRows: 15
              path-separator: "/"
              obfuscation-string: "*****"
            aris:
              - ari: "anja:totplugin:updateTags:/Virtualizador/Denodo/Territorio/"    # Tripleta sirve para actualización de tags
              - ari: "anja:totplugin:sample:/Virtualizador/Denodo/Territorio/"        # Tripleta sirve para sampleo
              - ari: "anja:totplugin:extract:/Virtualizador/Denodo/Territorio/"       # Tripleta sirve para extracción de metadatos
              - ari: "anja:totplugin:edit:/Virtualizador/Denodo/Territorio/"          # Tripleta sirve para edicion 
              - ari: "anja:totplugin:im:/Virtualizador/Denodo/Territorio/"            # Tripleta sirve para gestión de permisos de acceso, creación del rol en Denodo
                imAri: "anja:totplugin:im:/ldap/ldap/ldap/"                           # Tripleta sirve para gestión de permisos de acceso, creación del grupo en el AD via protocolo LDAP
      

Tómese el fragmento de configuración del YAML a modo de ejemplo para configuración de las tripletas. La configuración técnica debe revisarse en el documento propio del plugin.

Configuración de tripletas

Una vez diseñadas y definidas las tripletas, se debe realizar la configuración funcional. Para ello, revisar la configuración de Metamodelo y plantillas de metadatos donde se explica cómo configurar:

  • Los atributos de infraestructura, tecnología y zona en Attribute Definitions.

  • Configurar los valores que pueden adquirir los atributos de infraestructura, tecnología y zona en Attribute Definition Values.

  • Asignar los atributos en las plantillas de los objetos del metamodelo en Template Attribute.

  • Configurar la validación de dependencia entre infraestructura --> tecnología-->zona en Template Attribute Validation.

  • Configurar las relaciones entre los valores de las tripletas Attribute Relationships.

Una vez realizada la configuración funcional, se debe hacer la configuración técnica, incluyendo la configuración de las tripletas que han definido a nivel funcional. Para ello:

  • Abrir el YAML de configuración del plugin

  • Configurar la ari del YAML vinculando la funcionalidad del plugin con la tripleta. La ari debe estar configurada con los valores configurados en el campo name de Attribute Definition Values, no con los valores de traducción (value de Translations)

Una ari es una propiedad dentro de la configuración YAML que vincula una funcionalidad concreta del plugin (extract, sample, updateTag…) con una tripleta.
Cada funcionalidad (sampleo, extracción de metadatos, permisos, tags, etc.) necesita su propia ari dentro del fichero de configuración del plugin (YAML).

Importante:

Si durante la importación de metadatos en el wizard de creación del Portal de datos, al seleccionar una tripleta aparece un error que indica “No existe un plugin para extract” es probable que el error sea debido a alguno de los siguientes motivos:

  • Que la ari no esté bien configurada en el YAML del plugin:

    • La ari debe coincidir exactamente con los valores configurados en el campo name de Attribute Definition Values, nunca con los valores de traducción (value de Translations)

  • Que los valores de traducción seleccionados por el usuario en el wizard no correspondan con los valores del plugin.

    • Revisar que los key de la tabla Languages correspondientes a las traducciones seleccionadas en el wizard (value) corresponden con los valores de name en la tabla Attribute Definition Value.

    • Revisar que los valores de name en la tabla Attribute Definition Value corresponden con los configurados en la ari.

image-20250916-120410.png


Activación de funcionalidades

Una vez desplegado el plugin y configurada la tripleta, Anjana Data valida automáticamente en qué contexto debe activarse cada funcionalidad.

  • Extracción de metadatos: se activa al crear un objeto con “metadato automático” en el wizard de Creación de objetos del Portal de datos, permitiendo descubrir estructuras de las fuentes.

  • Sample Data: al acceder a la pestaña de Datos de muestra de un DATASET, lanza queries para traer muestras de datos, ofuscando el contenido de los campos (DATASET_FIELD) marcados con el atributo pi a true.

  • Gestión de accesos: incluye las siguientes capacidades:

    • Al finalizar un workflow de creación de DSA, crea un grupo en el AD, IAM o sistema de gestión de identidades donde esté delegada la autenticación de usuarios de la tecnología habilitada y un rol con permisos en la tecnología.

      • Por ejemplo, creación de un grupo en el AD con nombre formado por <prefijo configurado en el plugin><nombre del DSA><versión del DSA>

        image-20250916-152936.png
        Ejemplo de grupo creado en el AD
      • Por ejemplo, creación del rol y asignación de permisos en Denodo con nombre formado por <prefijo configurado en el plugin><nombre del DSA><versión del DSA>

        image-20250916-153432.png
        Ejemplo de rol creado en Denodo
    • Al finalizar un workflow de adherencia, se añade al usuario adherido al grupo y se le otorga el rol. De esta forma, el usuario al acceder a Denodo, puede lanzar queries sobre los DATASET incluidos en el DSA al que se ha adherido.

      image-20250916-161244.png
      Ejemplo de como el usuario adherido tiene acceso a las business entities contenidas en el DSA

Condiciones para habilitar las funcionalidades de los plugins

Para que las funcionalidades de muestra de datos, gestión de permisos de acceso, tags, etc habilitadas en el YAML del plugin se ejecuten sobre un activo gobernado en Anjana Data Platform es necesario:

  1. Que el objeto gobernado haya sido creado con los valores de la tripleta del plugin

  2. Que el objeto se encuentre en estado Aprobado.

  3. Que el atributo isGoverned esté activado en la plantilla (indica que el activo está conectado a plataforma).

  4. Para habilitar la pestaña de Muestra de datos (sample data), se necesita adicionalmente que el atributo sampleData esté habilitado en la plantilla.

image-20250916-162228.png
Ejemplo de isGoverned y sampleData activados en la plantilla de un dataset aprobado para habilitar las funcionalidades de los plugins