La qualité est un aspect très important de la technologie aux yeux de nos clients, c’est pourquoi Textkernel en a fait une de ses priorités. Afin de continuer à améliorer la qualité de ses logiciels, Textkernel explore en permanence de nouvelles techniques pour optimiser ses modèles d’extraction.
Les recherches récemment menées par Textkernel concernent la nouvelle technologie du Deep Learning. Le Deep Learning regroupe un ensemble d’algorithmes appliqués à de grandes quantités de données afin d’apprendre automatiquement des représentations de mots similaires. Par exemple, dans un système d’extraction de CV, les mots « Amsterdam » et « Paris » sont tous deux utilisés dans le contexte de « ville ». Lorsqu’un nouveau mot avec des représentations similaires à Amsterdam et Paris est détecté, il y a de fortes chances pour que ce nouveau mot soit également une ville. Grâce au Deep Learning, le modèle d’extraction de CV est plus performant, car il peut apprendre automatiquement la sémantique de nouveaux mots.
L’équipe d’analyse de CV de Textkernel a réalisé des recherches innovantes pour appliquer la technologie du « Deep Learning » à ses modèles d’extraction. Bien que Textkernel n’en soit qu’à la phase préliminaire de l’implémentation de cette technique de pointe, les premiers résultats sur les modèles d’extraction de CV sont déjà très prometteurs. Avec des améliorations qualitatives considérables apportées aux modèles d’extraction anglais et français, Textkernel est fier de présenter la technologie du Deep Learning intégrée dans la version 2014.1 de Extract! CV Parsing.
Lisez ci-dessous l’integralité des notes de lancement de la version 2014.1 de Extract! CV parsing.
Textkernel Extract! CV parsing – 2014.1 release
- Prise en charge du traitement automatique des données des profils DoYouBuzz JSON
Cela devient possible grâce au widget « Apply with DoYouBuzz ». Connaissez-vous le widget « apply with »? Ce widget permet aux candidats de postuler via le média de leur choix (par exemple leur CV ou leur profil LinkedIn, Xing, Viadeo, Google+ ou Facebook). Dans le même temps, vous recevez les informations complètes de leur profil, structurées automatiquement selon le format de votre base de données. Il est désormais également possible de postuler avec un CV DoYouBuzz à l’aide du widget « apply with ».
- Améliorations du traitement des fichiers PDF avec polices intégrées (prise en charge OCR requise)
Auparavant, dans les fichiers PDF contenant des polices intégrées, les lettres étaient fréquemment converties en points d’interrogation. Textkernel peut à présent détecter ces documents contenant des polices intégrées et les traiter par OCR (lorsque l’OCR est activé pour votre compte). Cela permet d’optimiser l’extraction et de trouver des candidats plus facilement.
- Espagnol : améliorations dans tous les champs
Au cours des derniers mois, Textkernel a également réalisé des recherches fructueuses pour le modèle linguistique espagnol. Dans la version 2014.1, des améliorations importantes ont été apportées à tous les champs du CV espagnol, avec un effort particulier sur les champs relatifs aux éléments personnels et à l’expérience.
- Anglais : améliorations de l’analyse des CV indiens
Des améliorations dans l’extraction de CV indiens en anglais ont été apportées aux champs suivants :- les données personnelles, notamment pour le traitement du nom et de l’adresse
- les éléments d’expérience mentionnant une durée plutôt qu’une période (par exemple : 1 an ou 2 mois)
- les aptitudes linguistiques
- Anglais et français : améliorations à l’aide de la technique du Deep Learning
Grâce à la mise en place du Deep Learning, la version 2014.1 comporte d’importantes améliorations pour toutes les sections des modèles anglais et français.
- Allemand : améliorations concernant
- l’identification des pages (détection des pages de CV dans les fichiers PDF numérisés)
- extraction des CV chronologiques (CV avec des éléments de formation et d’expérience rassemblés chronologiquement dans une longue section)
- l’extraction de l’intitulé du poste
- Italien : améliorations du traitement des données personnelles
Vous souhaitez en savoir plus sur notre logiciel d’analyse de CV ou le tester vous-même ?
Contactez-nous pour une démonstration.