Le département R&D de Textkernel est fier d’annoncer la sortie d’une nouvelle version d’ Extract! CV Parsing . La version 2015.1 inclut un nouveau modèle d’analyse des CV Hongrois et des améliorations aux modèles anglais, allemand et néerlandais.
Nouveau: CV parsing Hongrois
Textkernel travaille au développement d’un nouveau modèle d’extraction de CV hongrois depuis la fin de 2014. Nous sommes fier de pouvoir annoncer sa complétion. Avec le hongrois, ce sont au total 16 langues qui sont supportées par notre logiciel de parsing.
Le développement du modèle d’extraction hongrois
Développer un nouveau modèle d’extraction est un processus complexe. Tout d’abord un large volume de CV doit être annoté. Des étudiants hongrois spécialisés en linguistique ont été engagés pour travailler sur l’identification des différentes sections d’un CV (expérience professionnelle, éducation) ainsi que des éléments plus spécifiques tels que le coordonées d’une entreprise, le libellé d’un poste, le nom d’un diplôme.
Les chercheurs de Textkernel ont ensuite entrainé leur machine de parsing asur ces CV annotés. Le modèle développé a été optimisé en utilisant des CV hongrois supplémentaire jusqu’à ce que les performances désirées soient atteintes. Enfin un programme capable de reconnaitre la langue hongroise a été installé permettant le routage automatique des CV vers le modèle de parsing Hongrois.
Améliorer le parsing de CV allemands avec le Deep Learning
L’année dernière l’équipe R&D de Textkernel a testé pour le première fois et implémenté des techniques de Deep Learning our encore améliorer les performances de son logiciel de parsing. Après les succès rencontrés avec les modèles anglais et français, le Deep Learning est maintenant utilisé pour améliorer l’analyse et l’extraction de CV allemands. Cette nouvelle technologie a notamment permis d’améliorer l’extraction des données relatives à l’expérience et à l’éducation du candidat.
Améliorer le parsing néerlandais et anglais
Amélioration du parsing de CV néerlandais et anglais.
- Néerlandais: amélioration de l’extraction de noms composés de ville (ex: La Haye)
- Néerlandais: amélioration de l’extraction de noms
- Anglais: amélioration de l’extraction de numéros de téléphone indiens
Pour plus d’information sur celle nouvelle version ou a propos du logiciel de CV parsing de Textkernel, contactez Textkernel.