Posted on December 20, 2016

Nieuwe release Extract! nu met parsing Griekse cv’s

Textkernel is blij een nieuwe versie van Extract! cv parsing te kunnen releasen. Deze release bevat verbeteringen voor alle talen, specifieke verbeteringen voor Engels, Vlaams, Slovaaks en Frans én een nieuwe taal: Grieks.

Nieuw: Griekse cv parsing

Aanhakend op vragen uit de markt, introduceert Textkernel haar zeventiende taal voor cv parsing: Grieks. Om een nieuwe taal toe te kunnen voegen wordt onze parser uitvoerig getraind en afgestemd met behulp van cv’s uit de doeltaal. Het is de research engineers van Textkernel gelukt de rijkdom, diversiteit en complexiteit van de Griekse taal te overwinnen en een state-of-the-art-taalmodel te ontwikkelen. Lees de blogpost ‘Greek cv parsing, an Odyssey’, voor meer informatie over de ontwikkeling van een model van de Griekse taal.

education

Samenvatting van de verbeteringen

Het R&D team van Textkernel heeft de cv parser op diverse punten kunnen verbeteren, waar alle talen van profiteren.

Verbeteringen voor alle talen

  • Nieuw: extractie van Apple’s Pages file format (.pages).
    In navolging van standaard file types (zoals .doc, .docx, .pdf, .html, .text) kunnen Textkernel’s parsers nu ook ook Apple pages bestanden verwerken.
  • Ondersteuning van nog meer Microsoft Wordt en PDF file subtypes.
    Textkernel de preprocessor, die het originele cv in text-bestanden omzet die gebruikt worden voor parsing, verbeterd. Textkernel kan nu nog meer subtypes van Microsoft word en PDF cv’s verwerken.
  • Verbeterde extractie van telefoonnummers.
  • Verbeterde extractie van data.
  • Verbeterde extractie van vaardigheden.

Verbeteringen voor Engels 

  • Betere extractie van de naam van de kandidaat, specifiek wanneer alleen de eerste naam op cv vermeld wordt.
  • In de velden ‘werkervaring’ en ‘opleiding’:
    • Betere segmentatie van de onderdelen.
    • Betere herkenning van Engelse datumnotatie.
    • US: betere extractie van stad, regio en land.
    • US: betere extractie van bedrijfsnamen en locaties.

Andere verbeteringen

  • Betere extractie van namen van Belgische (Vlaamse) cv’s.
  • Slovaaks: verbeterde classificatie van opleiding en behaalde diploma’s.
  • Frans: verbeterde uitsplitsing van adressen.

Meer informatie

Wilt u meer weten over Textkernel’s cv parsing technologie of de nieuwe release? Neem contact met ons op.