Posted on December 19, 2016

Nouvelle version d’Extract! avec parsing de CV grec

Textkernel lance un nouvelle version de son logiciel de parsing de CV. Cette nouvelle version inclut le parsing de CV grec ainsi que de nombreuses améliorations générales mais aussi spécifiques aux modèles de langue Anglaise, Flamande, Slovaque et Française.

Nouveau: parsing de CV grecs

Pour répondre aux attentes de certains de nos clients, Textkernel viens d’ajouter une 17ème langue à son logiciel de Parsing: le grec. Afin d’inclure une nouvelle langue, le moteur de parsing de Textkernel doit être entraîné et réglé pour reconnaître et extraire des données à partir de CVs rédigés dans cette langue. Les ingénieurs de Textkernel ont réussi à maîtriser la complexité et la richesse de la langue grecque et à développer un modèle d’extraction de haute qualité.

A Greek CV parsed with Textkernel's CV parsing technology

Pour plus de details sur le développement du parsing de CV grec, lire le post “Greek CV parsing, an Odyssey (anglais)

Amélioration apportées au parsing pour toutes les langues

Notre équipe R&D a opéré de nombreuses mises à jour du moteur de parsing permettant d’améliorer la qualité du parsing pour toutes les langues.

  • Nouveau: extraction du format Pages file d’Apple (.pages)
    En plus des formats standards (comme par exemple .doc, .docx, .pdf .html, .text), les parsers de Textkernel sont maintenant capables de traiter les fichiers au format pages d’Apple.
  • Support pour encore plus de sous-types de fichier Microsoft Word et PDF
    Textkernel a opéré des améliorations sur son pré-processeur, qui convertit the CV original en texte qui est ensuite utilisé pour le parsing. Textkernel est maintenant capable d’accepeter encore plus de sous-types de CV au format Microsoft Word et PDF
  • Amélioration de l’extraction de numéro de téléphone
  • Amélioration de l’extraction des dates
  • Amélioration de l’extraction des compétences

Améliorations spécifiques à certaines langues

  • Anglais: meilleure extraction du nom des candidats, en particulier quand seulement le prénom est présent dans le CV.
  • Anglais: améliorations apportées aux sections experience professionnelle et éducation:
    • Meilleure segmentation des itèmes
    • Meilleure reconnaissance des dates en format anglais
  • USA: meilleure extraction des villes, régions et pays
  • USA: meilleure extraction des entreprises et leurs localisations
  • Belge: Meilleure extraction des noms sur les CV flamands
  • Slovaque: amélioration de la classification des itèmes éducation et diplômes
  • Français: meilleure extraction des adresses

Plus d’information

Vous voulez en savoir plus sur la technologie de parsing de Textkernel ou sur cette nouvelle version ? Contactez nous!