
Mise à jour chaque année par l’équipe d’économistes en chef de la DG GROW, cette page fournit le résultat d’une mise en correspondance effectuée entre les titulaires de comptes dans le journal des transactions de l’UE (EUTL) et la base de données Orbis de Moody’s. Grâce aux codes d’identification de l’entreprise, l’utilisateur peut facilement extraire des données supplémentaires d’Orbis, obtenant ainsi un ensemble de données au niveau de l’entreprise avec à la fois des indicateurs climatiques (par exemple, les émissions annuelles, l’allocation de quotas à titre gratuit sur le marché du carbone de l’UE, etc.) et financiers (par exemple, le chiffre d’affaires, l’emploi, etc.).
Cette mise en correspondance fait suite aux travaux de Simon Letout dans le cadre d’un projet conjoint JRC/DG GROW. Les codes d’identification de l’entreprise concernés sont publiés en accord avec Moody’s.
Ensemble de données
Voir le résultat de la correspondance (fichier Excel).
Comment citer: Commission européenne, équipe d’économistes en chef de la DG GROW (2024): EUTL-Orbis matching dataset [Ensemble de données].
Procédure d’appariement
La procédure d’appariement repose sur des techniques de traitement du langage naturel (NLP), résumées ci-dessous.
Voir la procédure d’appariement complète et le code utilisé (écrit en Python).
Étape 1: Nettoyage des variables
Étape 2: Mise en correspondance de la PNL sur les noms d’entreprises et les identifiants juridiques
Étape 3: Mesure de similarité sur les codes postaux
Étape 4: Filtrage des correspondances potentielles, ce qui permet à la grande majorité des entreprises d’avoir une seule option de correspondance dominante
Comment citer: Cameron, A. & Ho, V. (2024): Correspondance entre le journal des transactions de l’UE et ORBIS: Une approche de traitement du langage naturel.
Correspondances précédentes
- Mise en correspondance 2021 (effectuée avec les données de l’EUTL de 2020) – cette mise en correspondance a utilisé cette méthodologie dans le cadre d’un projet conjoint JRC/DG GROW.