Aller au contenu

Dbt

dbt : Les tests dans les YAML, ou comment arrêter de prier pour que les données soient correctes

Tu connais cette sensation : un rapport qui sort des chiffres bizarres, un analyste qui te dit “les totaux matchent pas”, et tu passes ta journée à remonter la chaîne pour trouver où les données ont dérapé. Souvent, le problème aurait pu être détecté automatiquement si quelqu’un avait mis un test quelque part.

dbt : Quand tes fichiers YAML deviennent ta gouvernance de données

La documentation, c’est le truc que personne ne veut faire. Surtout en data. T’as des centaines de colonnes dans des dizaines de tables, et quelqu’un te demande “c’est quoi le champ status dans la table orders ?” Et la réponse honnête, c’est souvent “euh… un enum je pense qui veut probablement dire X.”

dbt : tes transformations de données comme de l'infrastructure

·2457 mots·12 mins
Snowflake est fondamentalement SQL-first. C’est sa force : tout se pilote en SQL, des grants à la création d’objets en passant par les transformations. L’infrastructure, on a vu comment la dompter avec Terraform dans l’article précédent. Mais les transformations de données, elles, tombent dans un angle mort. Des scripts SQL éparpillés, pas de tests, pas de versioning sérieux, un seul collègue qui sait dans quel ordre tout lancer.