“Lundi matin, 9h. Trois dashboards affichent trois chiffres d'affaires différents pour la même entreprise. Lequel est le bon ? Pourquoi ces écarts ? La documentation est obsolète, les experts ont changé de poste, et la réunion de crise a déjà commencé.”
Cette situation vous rappelle quelque chose ? En tant que professionnelle de la data, j'ai régulièrement endossé la casquette d'investigateur pour résoudre ces “crimes” de données. Tracer la provenance des données dans des systèmes complexes (Excel + VBA, Power BI, BusinessObjects…) devient rapidement un casse-tête lorsque les informations sont transformées, agrégées et dispersées entre plusieurs outils. Ce talk présente une méthodologie d'investigation basée sur les graphes de lignage (lineage graphs), implémentée en Python avec NetworkX. À travers un cas concret d'analyse de rapports analytiques complexes, je démontrerai comment cette approche permet de : Cartographier visuellement les flux de données et leurs transformations Identifier rapidement les sources de divergences entre rapports Faciliter l'audit, le debugging et l'optimisation des pipelines Documenter efficacement des systèmes legacy Je partagerai également l'outil Python que j'ai développé pour appliquer cette méthode au quotidien, avec des exemples reproductibles.