El metamodelo en Anjana Data constituye la base conceptual sobre la que se gobiernan los distintos activos de datos e información de la organización. Su configuración permite definir de manera explícita:
-
Las entidades que se gestionarán (ej. datasets, informes, modelos de IA, términos de negocio).
-
Las relaciones entre esas entidades (ej. entrenado con, compuesto de, usado).
La correcta definición del metamodelo es fundamental para:
-
Representar la realidad de los datos en la organización de forma clara y estructurada.
-
Establecer un marco común que soporte los procesos de gobierno y gestión de activos.
-
Asegurar la coherencia en la navegación, búsqueda, linaje y auditoría dentro del Portal de Datos.
En esta sección se detallan los pasos y consideraciones necesarias para configurar los distintos componentes del metamodelo:
-
Subtipos de entidades: definición de los tipos de objetos a gobernar (ej. datasets, informes, modelos de IA, términos de negocio).
-
Subtipos de relaciones: definición de los vínculos entre entidades que reflejan dependencias, jerarquías o asociaciones (ej. entrenado con, compuesto de, usado).
Junto con el metamodelo, las plantillas de metadatos permiten parametrizar la forma en la que se describen y documentan los activos de datos y sus relaciones en la plataforma. Estas plantillas incluyen la creación y ajuste de:
-
Menús y secciones para estructurar la información.
-
Atributos de distintas tipologías (texto, numéricos, taxonomías, listas, etc.).
-
Validaciones y reglas de versionado que aseguran calidad, consistencia y control de impactos en la gestión de los datos.
Notas importantes
-
El metamodelo debe permanecer relativamente estable en el tiempo, ya que refleja la semántica y lógica de negocio de la organización.
-
Los cambios en la estructura del metamodelo pueden impactar directamente en:
-
El histórico de activos gobernados.
-
El linaje de los datos.
-
Los workflows configurados.
-
La configuración de permisos.
-
La experiencia de usuario en el Portal de Datos.
-
-
Anjana Data incluye un metamodelo nativo, que aporta lógica y soporte a funcionalidades propias de la plataforma.
Metamodelo nativo de Anjana Data
Anjana Data incluye un metamodelo nativo que define un conjunto de entidades y relaciones con una lógica interna dentro de la plataforma. Este metamodelo proporciona la base mínima necesaria para que el portal de datos funcione de forma coherente desde el inicio y para que los administradores puedan extenderlo y adaptarlo según las necesidades de gobierno de la organización.
Entidades nativas
Las entidades que se gobiernan de manera nativa en Anjana Data son:
-
DATASET: Se trata de un conjunto de datos estructurados, semiestructurados o no estructurados —persistentes o transitorios— que puede representar tablas de bases de datos, ficheros en data lakes, documentos, imágenes, audios o vídeos.
-
DATASET_FIELD: Se trata de un campo o columna de un dataset estructurado, con sus propios metadatos, que permite gobernar los datos a nivel de atributo individual.
-
DSA (Data Sharing Agreement): acuerdo o contrato de compartición de datos.
-
PROCESS: proceso de negocio o técnico que gestiona datos.
-
INSTANCE: ejecución o instancia concreta de un proceso.
-
SOLUTION: solución o aplicación que agrupa y gestiona instancias y procesos.
Relaciones nativas entre entidades nativas
El metamodelo nativo incluye también las siguientes relaciones predefinidas:
-
STRUCTURE: entre un dataset (origen) y sus dataset fields (destino).
-
DSA_CONTENT: entre un DSA (origen) y las entidades que contiene (destino).
-
ADHERENCE: entre un DSA (origen) y un User (destino).
-
INSTANCE_PROCESS: pertenencia de una instancia (destino) a su proceso (origen).
-
INSTANCE_DATASET_IN: entre una instancia (destino) y los datasets de los que lee (origen).
-
INSTANCE_DATASET_OUT: entre una instancia (origen) y los datasets en los que escribe (destino).
-
SOLUTION_RELATED_INSTANCE: entre una solución (origen) y sus instancias relacionadas (destino).
-
SOLUTION_OWNED_INSTANCE: pertenencia de una instancia (destino) a su solución propietaria (origen).
Nota importante:
-
Estas entidades y relaciones forman parte del núcleo nativo de Anjana Data y aportan la lógica necesaria para funcionalidades básicas de la plataforma, como la búsqueda, el linaje y el control de adherencias.
-
El administrador puede ampliar y personalizar el metamodelo incorporando nuevas entidades, relaciones y reglas, siempre respetando la coherencia con este metamodelo base.
Orden de configuración del metamodelo y las plantillas de metadatos
Una vez entendido el metamodelo nativo de Anjana Data (entidades y relaciones predefinidas), es importante seguir un orden lógico en la configuración del metamodelo extendido y de las plantillas de metadatos.
El proceso recomendado es el siguiente:
-
Metamodelo – Entidades y relaciones: definición de los subtipos de objeto (entidades y relaciones) que compondrán el metamodelo.
-
Menús de las plantillas: creación de los bloques principales de primer nivel que organizan la información en formularios dinámicos.
-
Secciones de las plantillas: configuración de los subapartados dentro de cada menú, que permiten agrupar atributos relacionados.
-
Atributos de metadatos: definición de los atributos que describen las entidades y relaciones, reutilizables en distintas plantillas.
-
Valores de referencia: parametrización de los valores disponibles para atributos de tipo selección (listas, taxonomías, iconos, etc.).
-
Asignación de atributos a plantillas: inclusión de los atributos en las secciones correspondientes de cada plantilla.
-
Validaciones sobre plantillas: definición de reglas para garantizar la coherencia y restricciones de los atributos.
-
Relaciones entre valores de referencia: establecimiento de dependencias entre valores de atributos de referencia o estructuras jerárquicas en taxonomías.
-
Reglas de versionado: configuración de los cambios que generan una nueva versión de los objetos gobernados.
-
Reglas de excepción al lanzamiento de workflows: definición de excepciones que evitan el disparo de workflows de aprobación en modificaciones o versionados concretos.
De esta forma, se asegura una configuración ordenada, coherente y sostenible del metamodelo y de las plantillas de metadatos.