Configuración
Breadcrumbs

Metamodelo y plantillas de metadatos

El metamodelo en Anjana Data constituye la base conceptual sobre la que se gobiernan los distintos activos de datos e información de la organización. Su configuración permite definir de manera explícita:

  • Las entidades que se gestionarán (ej. datasets, informes, modelos de IA, términos de negocio).

  • Las relaciones entre esas entidades (ej. entrenado con, compuesto de, usado).

La correcta definición del metamodelo es fundamental para:

  • Representar la realidad de los datos en la organización de forma clara y estructurada.

  • Establecer un marco común que soporte los procesos de gobierno y gestión de activos.

  • Asegurar la coherencia en la navegación, búsqueda, linaje y auditoría dentro del Portal de Datos.

En esta sección se detallan los pasos y consideraciones necesarias para configurar los distintos componentes del metamodelo:

  • Subtipos de entidades: definición de los tipos de objetos a gobernar (ej. datasets, informes, modelos de IA, términos de negocio).

  • Subtipos de relaciones: definición de los vínculos entre entidades que reflejan dependencias, jerarquías o asociaciones (ej. entrenado con, compuesto de, usado).

Junto con el metamodelo, las plantillas de metadatos permiten parametrizar la forma en la que se describen y documentan los activos de datos y sus relaciones en la plataforma. Estas plantillas incluyen la creación y ajuste de:

  • Menús y secciones para estructurar la información.

  • Atributos de distintas tipologías (texto, numéricos, taxonomías, listas, etc.).

  • Validaciones y reglas de versionado que aseguran calidad, consistencia y control de impactos en la gestión de los datos.

Notas importantes

  • El metamodelo debe permanecer relativamente estable en el tiempo, ya que refleja la semántica y lógica de negocio de la organización.

  • Los cambios en la estructura del metamodelo pueden impactar directamente en:

    • El histórico de activos gobernados.

    • El linaje de los datos.

    • Los workflows configurados.

    • La configuración de permisos.

    • La experiencia de usuario en el Portal de Datos.

  • Anjana Data incluye un metamodelo nativo, que aporta lógica y soporte a funcionalidades propias de la plataforma.

Metamodelo nativo de Anjana Data

Anjana Data incluye un metamodelo nativo que define un conjunto de entidades y relaciones con una lógica interna dentro de la plataforma. Este metamodelo proporciona la base mínima necesaria para que el portal de datos funcione de forma coherente desde el inicio y para que los administradores puedan extenderlo y adaptarlo según las necesidades de gobierno de la organización.

Entidades nativas

Las entidades que se gobiernan de manera nativa en Anjana Data son:

  • DATASET: Se trata de un conjunto de datos estructurados, semiestructurados o no estructurados —persistentes o transitorios— que puede representar tablas de bases de datos, ficheros en data lakes, documentos, imágenes, audios o vídeos.

  • DATASET_FIELD: Se trata de un campo o columna de un dataset estructurado, con sus propios metadatos, que permite gobernar los datos a nivel de atributo individual.

  • DSA (Data Sharing Agreement): acuerdo o contrato de compartición de datos.

  • PROCESS: proceso de negocio o técnico que gestiona datos.

  • INSTANCE: ejecución o instancia concreta de un proceso.

  • SOLUTION: solución o aplicación que agrupa y gestiona instancias y procesos.

Relaciones nativas entre entidades nativas

El metamodelo nativo incluye también las siguientes relaciones predefinidas:

  • STRUCTURE: entre un dataset (origen) y sus dataset fields (destino).

  • DSA_CONTENT: entre un DSA (origen) y las entidades que contiene (destino).

  • ADHERENCE: entre un DSA (origen) y un User (destino).

  • INSTANCE_PROCESS: pertenencia de una instancia (destino) a su proceso (origen).

  • INSTANCE_DATASET_IN: entre una instancia (destino) y los datasets de los que lee (origen).

  • INSTANCE_DATASET_OUT: entre una instancia (origen) y los datasets en los que escribe (destino).

  • SOLUTION_RELATED_INSTANCE: entre una solución (origen) y sus instancias relacionadas (destino).

  • SOLUTION_OWNED_INSTANCE: pertenencia de una instancia (destino) a su solución propietaria (origen).


Nota importante:

  • Estas entidades y relaciones forman parte del núcleo nativo de Anjana Data y aportan la lógica necesaria para funcionalidades básicas de la plataforma, como la búsqueda, el linaje y el control de adherencias.

  • El administrador puede ampliar y personalizar el metamodelo incorporando nuevas entidades, relaciones y reglas, siempre respetando la coherencia con este metamodelo base.

Orden de configuración del metamodelo y las plantillas de metadatos

Una vez entendido el metamodelo nativo de Anjana Data (entidades y relaciones predefinidas), es importante seguir un orden lógico en la configuración del metamodelo extendido y de las plantillas de metadatos.

El proceso recomendado es el siguiente:

  1. Metamodelo – Entidades y relaciones: definición de los subtipos de objeto (entidades y relaciones) que compondrán el metamodelo.

  2. Menús de las plantillas: creación de los bloques principales de primer nivel que organizan la información en formularios dinámicos.

  3. Secciones de las plantillas: configuración de los subapartados dentro de cada menú, que permiten agrupar atributos relacionados.

  4. Atributos de metadatos: definición de los atributos que describen las entidades y relaciones, reutilizables en distintas plantillas.

  5. Valores de referencia: parametrización de los valores disponibles para atributos de tipo selección (listas, taxonomías, iconos, etc.).

  6. Asignación de atributos a plantillas: inclusión de los atributos en las secciones correspondientes de cada plantilla.

  7. Validaciones sobre plantillas: definición de reglas para garantizar la coherencia y restricciones de los atributos.

  8. Relaciones entre valores de referencia: establecimiento de dependencias entre valores de atributos de referencia o estructuras jerárquicas en taxonomías.

  9. Reglas de versionado: configuración de los cambios que generan una nueva versión de los objetos gobernados.

  10. Reglas de excepción al lanzamiento de workflows: definición de excepciones que evitan el disparo de workflows de aprobación en modificaciones o versionados concretos.

De esta forma, se asegura una configuración ordenada, coherente y sostenible del metamodelo y de las plantillas de metadatos.