Welcome to Delicate template
Header
Just another WordPress site
Header

Lot 1 : ANNOTATION MANUELLE DU TRIPLET RÉSULTAT

1) Annotation automatique des entités nommées : article EGC 2022

 

NER sur décisions judiciaires françaises : CamemBERT
Judiciaire ou méthode ensembliste ?

Sid Ali Mahmoudi, Charles Condevaux, Bruno Mathis∗∗, Guillaume Zambrano,
Stéphane Mussard

  • Détection automatique des entités dans une décision : les personnes physiques, leurs fonctions, la date du jugement, la ville, la juridiction, le numéro RG de la décision, et les normes juridiques.
  • Un transformer « CamemBERT Judiciaire » a été créé
  • Une méthode d’ensemble basée sur des Bi-LSTM-CRF a été créée
  • Explication du code + data annotées : lien

 

Résumé :

Nous étudions dans cet article les apports respectifs de différentes représentations de mots, de la méthode ensembliste et d’un transformer spécialisé que nous appelons CamemBERT judiciaire, sur la tâche de recherche d’entités nommées dans les décisions de justice françaises. Nous comparons les performances des modèles BiLSTM-CRFs entre eux, individuellement ou constitués en ensembles, et avec le modèle de Tagny (2019) pris comme référence à battre. Les résultats obtenus montrent une amélioration.