Posted on March 27, 2015

Nouveau: parsing de CV Hongrois (Extract 2015.1)

Le département R&D de Textkernel est fier d’annoncer la sortie d’une nouvelle version d’ Extract! CV Parsing . La version 2015.1 inclut un nouveau modèle d’analyse des CV Hongrois et des améliorations aux modèles anglais, allemand et néerlandais.

Nouveau: CV parsing Hongrois

Textkernel travaille au développement d’un nouveau modèle d’extraction de CV hongrois depuis la fin de 2014. Nous sommes fier de pouvoir annoncer sa complétion. Avec le hongrois, ce sont au total 16 langues qui sont supportées par notre logiciel de parsing.

Le développement du modèle d’extraction hongrois
Hungarian-CVDévelopper un nouveau modèle d’extraction est un processus complexe. Tout d’abord un large volume de CV doit être annoté. Des étudiants hongrois spécialisés en linguistique ont été engagés pour travailler sur l’identification des différentes sections d’un CV (expérience professionnelle, éducation) ainsi que des éléments plus spécifiques tels que le coordonées d’une entreprise, le libellé d’un poste, le nom d’un diplôme.

Les chercheurs de Textkernel ont ensuite entrainé leur machine de parsing asur ces CV annotés. Le modèle développé a été optimisé en utilisant des CV hongrois supplémentaire jusqu’à ce que les performances désirées soient atteintes. Enfin un programme capable de reconnaitre la langue hongroise a été installé permettant le routage automatique des CV vers le modèle de parsing Hongrois.

Améliorer le parsing de CV allemands avec le Deep Learning

L’année dernière l’équipe R&D de Textkernel a testé pour le première fois et implémenté des techniques de Deep Learning  our encore améliorer les performances de son logiciel de parsing. Après les succès rencontrés avec les modèles anglais et français, le Deep Learning est maintenant utilisé pour améliorer l’analyse et l’extraction de CV allemands. Cette nouvelle technologie a notamment permis d’améliorer l’extraction des données relatives à l’expérience et à l’éducation du candidat.

Améliorer le parsing néerlandais et anglais

Amélioration du parsing de CV néerlandais et anglais.

  • Néerlandais: amélioration de l’extraction de noms composés de ville (ex: La Haye)
  • Néerlandais: amélioration de l’extraction de noms
  • Anglais: amélioration de l’extraction de numéros de téléphone indiens

Pour plus d’information sur celle nouvelle version ou a propos du logiciel de CV parsing de Textkernel, contactez Textkernel.