Autres publications

Mise en correspondance du journal des transactions de l’UE avec la base de données Orbis

Publié le 20 janvier 2025

Mise à jour chaque année par l’équipe d’économistes en chef de la DG GROW, cette page fournit le résultat d’une mise en correspondance effectuée entre les titulaires de comptes dans le journal des transactions de l’UE (EUTL) et la base de données Orbis de Moody’s. Grâce aux codes d’identification de l’entreprise, l’utilisateur peut facilement extraire des données supplémentaires d’Orbis, obtenant ainsi un ensemble de données au niveau de l’entreprise avec à la fois des indicateurs climatiques (par exemple, les émissions annuelles, l’allocation de quotas à titre gratuit sur le marché du carbone de l’UE, etc.) et financiers (par exemple, le chiffre d’affaires, l’emploi, etc.).

Cette mise en correspondance fait suite aux travaux de Simon Letout dans le cadre d’un projet conjoint JRC/DG GROW. Les codes d’identification de l’entreprise concernés sont publiés en accord avec Moody’s. 

Ensemble de données

Voir le résultat de la correspondance (fichier Excel).

Comment citer: Commission européenne, équipe d’économistes en chef de la DG GROW (2024): EUTL-Orbis matching dataset [Ensemble de données].

Procédure d’appariement

La procédure d’appariement repose sur des techniques de traitement du langage naturel (NLP), résumées ci-dessous. 

Voir la procédure d’appariement complète et le code utilisé (écrit en Python).

Étape 1: Nettoyage des variables

Étape 2: Mise en correspondance de la PNL sur les noms d’entreprises et les identifiants juridiques

Étape 3: Mesure de similarité sur les codes postaux

Étape 4: Filtrage des correspondances potentielles, ce qui permet à la grande majorité des entreprises d’avoir une seule option de correspondance dominante

Comment citer: Cameron, A. & Ho, V. (2024): Correspondance entre le journal des transactions de l’UE et ORBIS: Une approche de traitement du langage naturel.

Correspondances précédentes

Voir la page