Traitement des données

Données

Base Transparence Santé

Fichiers sources

L’archive de données publiées sur le site Data Gouv comprend 4 fichiers csv :

  • un annuaire des entreprises ayant effectué une déclaration
  • 3 fichiers de déclarations :
    • conventions qui liste les contrats
    • rémunérations versées en contrepartie d’une prestation
    • avantages qui liste les cadeaux offerts sans contrepartie

L’annuaire santé (RPPS) est également téléchargé. Il servira à obtenir des informations fiables sur les bénéficiaires physiques déclarées par les entreprises.

Fichiers nettoyés

Les fichiers nettoyés sont téléchargeables en suivant les liens suivants :

Ils sont soumis aux mêmes restrictions d’usage que les fichiers sources (voir section “Restriction d’usage” sur la page de connexion).

Note : Ces fichiers ne disposent pas encore d’une documentation autre que le code source du projet. Ne pas hésitez à poser des questions si vous utilisez ces données. De plus, le format de ces fichiers est amené à changer sans avertissement.

Tables PostgreSQL

Chacun de ces fichiers est nettoyé, puis ingéré dans une table d’une PostgreSQL, respectivement appelées :

  • entreprise
  • declaration_convention
  • declaration_avantage
  • declaration_remuneration
  • annuaire

Une vue declaration reprend les colonnes communes des 3 tables de déclarations, pour simplifier des analyses communes. Cette vue est la base des tableaux de bord exposés sur Metabase.