c01-informatica-platform-v2

Gestion des métadonnées : l'approche Informatica

Construire une base commune de métadonnées actives pour rapprocher les utilisateurs métiers et informatiques

Dans quelle mesure comprenez-vous vos données ? Pouvez-vous dire d'où elles viennent, où elles sont référencées, et si elles sont pertinentes pour vos initiatives d'analyse ou de reporting ?

Pour mieux comprendre toutes les informations disponibles dans votre entreprise et en exploiter toute la valeur, vous avez besoin de contexte. Les métadonnées fournissent cet élément crucial, et vous permettent de mieux comprendre la qualité, la pertinence et la valeur de vos données.

Les métadonnées vous aident à découvrir des données, à comprendre leur relation, à suivre la façon dont les données sont utilisées et à évaluer la valeur et les risques associés à leur utilisation. Alors que les données continuent de croître à un rythme explosif et d'être de plus en plus distribuées, elles se transforment en processus essentiels à la mission de l'entreprise — c'est pourquoi la gestion des métadonnées joue désormais un rôle central et stratégique dans la transformation numérique.

Regardez Amit Walia, President of Product and Solution Marketing d'Informatica, expliquer pourquoi la gestion des métadonnées est essentielle à la réussite à l'ère des Données 3.0.

Les métadonnées ont encore plus de valeur si elles sont actives — elles sont combinées au Machine Learning, complétées par les connaissances humaines, et intégrées. Elles rendent les processus de gestion de données de grande ampleur intelligents et dynamiques. Les métadonnées actives peuvent constituer la base vitale d'un système de gestion de données bien structuré et offrir des avantages tout au long du cycle de vie des projets de données. Par exemple, les métadonnées peuvent mettre en évidence des données manquantes, incorrectes ou anormales. En exploitant les métadonnées, vos systèmes peuvent automatiquement corriger et enrichir les données qui alimentent un rapport : cela évite ainsi des erreurs coûteuses et optimise la qualité de l'analyse pour améliorer la prise de décision.

Gestion des métadonnées Informatica

L'approche de gestion des métadonnées Informatica est conçue pour aider les entreprises à exploiter pleinement la valeur de toutes leurs données avec des métadonnées actives. La gestion des métadonnées Informatica permet aux entreprises de s'engager dans cette voie en exploitant quatre grandes catégories de métadonnées :

  • Techniques : schémas de bases de données, mappings et code, transformations, contrôles de qualité
  • Métiers : termes du glossaire, processus de gouvernance, contexte de l'application et contexte métier
  • Opérationnel et infrastructure : statistiques d'exécution, horodatages, métriques de volume, informations sur le fichier log, informations système et d'emplacement
  • Utilisation : évaluations des utilisateurs, commentaires, modèles d'accès

Les métadonnées de ces quatre catégories deviennent le socle d'une base commune de métadonnées. La gestion des métadonnées Informatica utilise un riche ensemble de fonctionnalités pour créer cette base partagée :

  • Collecter : analyser les métadonnées de tous les systèmes de données d'une entreprise dans le Cloud et sur site — y compris les bases de données et les systèmes de fichiers, les outils et processus d'intégration, ainsi que les outils d'analyse et de data science — avec un haut niveau de fidélité.
  • Organiser : documenter la vue métier des données à l'aide de termes du glossaire, concepts, relations et processus. Enrichir les métadonnées collectées avec ce contexte métier. Collecter les entrées utilisateurs sous forme d'évaluations, d'avis et de certifications pour aider à évaluer l'utilité des ressources de données pour les autres utilisateurs.
  • Déduire : appliquer l'outil d'intelligence pour dériver des relations qui ne sont pas évidentes dans les métadonnées collectées, y compris la traçabilité des données, la similarité des données et le classement des ensembles de données les plus utiles pour les différents types d'utilisateurs.
 

La puissance d'une plate-forme unifiée de métadonnées

En regroupant les métadonnées techniques, métiers, opérationnelles et d'utilisation, Informatica crée un graphique de connaissance des ressources de données d'une entreprise et de leurs relations. Nous rendons ce graphique de métadonnées actif en appliquant l'Intelligence Artificielle et le Machine Learning et en l'intégrant à toutes nos solutions de gestion de données.

Les métadonnées actives servent de base d'unification à l'Intelligent Data Platform d'Informatica, une plate-forme intégrée et modulaire qui vous permet de croître et d'évoluer à votre propre rythme, tout en répondant à toutes vos exigences en matière de gestion de données. Elles alimentent l'intelligence du moteur CLAIRE™, la première intelligence artificielle basée sur les métadonnées de l'industrie, pour accélérer et automatiser les processus de gestion et de gouvernance des données de base. CLAIRE exploite les métadonnées pour découvrir automatiquement les domaines de données, classer les données, identifier les données similaires et d'autres relations de données, recommander les mesures les plus efficaces à prendre et associer des termes métiers aux jeux de données physiques.

En faisant d'un catalogue de données intelligent un élément central de votre infrastructure de données, vous pouvez vous assurer que les métadonnées actives sont intégrées dans tous vos processus de gestion de données. Informatica Enterprise Data Catalog vous aide à capturer les métadonnées dans toute l'entreprise et à les transformer en métadonnées actives à l'aide de connecteurs étendus qui numérisent et indexent les métadonnées grâce à l'intelligence basée sur CLAIRE. Les métadonnées actives ajoutent l'automatisation et permettent aux utilisateurs de créer, de déployer et d'exploiter plus facilement et plus efficacement des applications de gestion des données pour l'analyse, la data science, la gouvernance et toute autre priorité de l'entreprise axée sur les données.

 

Avantages de la gestion active des métadonnées

L'approche de gestion active des métadonnées d'Informatica apporte une valeur ajoutée tout au long du cycle de vie de la gestion des données :

  • Analytique de nouvelle génération
    • Permet le libre-service via une recherche, une découverte et des recommandations simples pour des données pertinentes.
    • Fournit une vue complète des données, y compris la traçabilité, les relations et la qualité, afin d'améliorer la fiabilité des données à des fins d'analyse.
    • Aide à accélérer les projets d'IA/ML grâce à une meilleure visibilité des données pour la préparation, l'analyse et le développement agile de modèles de ML pour les applications d'IA.
  • Qualité et gouvernance des données
    • Découvre, classe et documente les éléments de données clés pour vous aider à prioriser les activités de gouvernance des données.
    • Fournit des métadonnées et une traçabilité détaillées pour relier les contextes technique et métier de la gouvernance de données.
    • Documente la qualité des données dans le contexte des systèmes et processus métiers afin d'accroître la visibilité des sources des problèmes de qualité des données.
  • Data Privacy
    • Établit une corrélation entre les relations entre les sujets individuels et les données personnelles provenant de sources structurées et non structurées pour aider à automatiser les demandes d'accès de sujets.
    • Assure le suivi du statut de protection, de l'accès, de la prolifération et de l'exposition aux risques des données sensibles afin d'accroître la transparence en matière de conformité.
  • Gestion des données de référence
    • Découvre et accélère l'intégration de nouvelles sources de données qui devraient faire partie de vos données de référence.
    • Déduit et recommande des attributs et des structures hiérarchiques supplémentaires pour simplifier l'enrichissement des modèles de données de référence.
  • Modernisation du Cloud
    • Permet une compréhension complète du paysage des données pour aider à prioriser les ensembles de données et les charges de travail en vue de la migration vers le Cloud.
    • Fournit une analyse détaillée de la traçabilité et de l'impact pour prendre en charge la migration vers le Cloud tout en limitant les interruptions
  • Intégration de données
    • Accélère le développement de pipelines d'intégration de données avec des recommandations sur les mappings pour extraire, transformer et livrer les données.
    • Dérive automatiquement la structure des appareils et fichiers logs désordonnés, ce qui les rend plus faciles à comprendre et à utiliser.
  • Opérations de développement pour la gestion des données
    • Fournit des analyses prédictives et des recommandations pour la planification de la capacité future.
    • Aide à gérer efficacement les changements grâce à des vues détaillées de la traçabilité et à une logique métier qui permettent des analyses d'impact par simulation.