Il est primordial d'utiliser des outils logiciels adaptés pour prévenir les problèmes avant, pendant et après l'intégration des données.
N'oubliez pas que le meilleur moyen d'éviter les risques et les retards dans vos projets est de découvrir les problèmes avant la phase de conception détaillée. La fluctuation des impératifs métiers et l'accélération des délais ne doivent pas vous faire perdre de vue l'importance de la recherche de données.
La recherche de données est un processus précis et parfois chronophage. Si l'on ne respecte pas les meilleures pratiques, on peut compromettre les données sensibles et générer des problèmes de conformité, voire faire échouer le projet tout entier. La meilleure approche repose sur la coopération entre un développeur qui travaille sous l'angle de l'informatique et un analyste de données qui privilégie l'aspect métier. Il est important d'utiliser des outils conçus pour la recherche de données, avant la phase d'intégration puis régulièrement par la suite.
Profilage en amont
Les volumes et les types de données sur lesquelles s'appuient les responsables d'entreprise pour prendre leurs décisions sont en augmentation. D'autre part, on demande de plus en plus souvent aux services informatiques de répondre aux besoins métiers. Pour encourager la coopération, il faut faire appel à des outils qui permettent aux responsables de l'entreprise de comprendre et d'analyser les données. Cela permettra d'éviter les problèmes de communication et les malentendus avant le début de la phase d'intégration.
Dé-bugger à la volée
Repérez les anomalies et contrôlez la qualité des données en continu durant les étapes d'intégration. Si vous vous reposez sur vos lauriers, vous vous exposez à des risques tels que défauts de conformité et menaces informatiques.
« Les outils de recherche de données deviennent de plus en plus nécessaires pour savoir où se trouvent les données sensibles », selon Adrian Lane, responsable des stratégies de sécurité chez Securosis. « Lorsqu'on a un schéma de base de données de production avec 40 000 tableaux, dont la plupart non documentés par les développeurs qui les ont créés, trouver les informations que l'on recherche, même dans une seule base de données, est une opération difficile. Reproduisez maintenant le même problème sur les bases de données financières, de RH, de processus métiers, de test et d'aide à la décision... Vous imaginez sans peine le cauchemar. » 1
Les outils les mieux adaptés
Étant donné le potentiel commercial du Big Data, certains éditeurs de logiciels présentent leurs produits comme des solutions de recherche de données. Repérer les problèmes de qualité des données est une tâche complexe même avec les meilleurs outils disponibles ; assurez-vous donc de bien vous renseigner au préalable.
Les logiciels de business intelligence (BI), par exemple, fournissent certes de jolis tableaux et graphiques, mais sans les fonctions d'automatisation propres aux vrais outils de recherche de données. Il faut pouvoir évaluer visuellement la qualité des données, déterminer l'efficacité conjointe et comprendre le lien entre les données et les processus métiers. Pour pouvoir révéler la structure sous-jacente des données et faire le lien entre les données de tel système et celles de tel autre, il faut des fonctions logicielles spécialisées et avancées.
Les responsables métiers sont constamment sous pression car on leur demande d'accélérer la réalisation des projets pour conserver l'avantage concurrentiel. Pourtant, l'efficacité diminue au fil du temps si les données ne sont pas profilées aussi souvent que nécessaire sur l'ensemble du processus. Pour tout savoir sur les meilleures pratiques, regardez le webinaire Double Productivity with Integrated Data Discovery, Profiling and Data Quality (Comment doubler votre productivité grâce à la recherche intégrée des données, le profilage et la qualité des données)
Ressources de l'article
- 1Lane, Adrian, « What Data Discovery Tools Really Do » (Ce que font vraiment les outils de recherche de données), Dark Reading, 20 janvier 2010.
La fluctuation des impératifs métiers et l'accélération des délais ne doivent pas vous faire perdre de vue l'importance de la recherche de données.”