Het ontwikkelen van cv parsing is een reis naar perfectie. Elke dag streven onze research engineers naar het verbeteren van de cv parsing-kwaliteit. In de nieuwe release (2015.2) van Extract! cv parsing lag de grootste focus op het verbeteren van het Engelse cv parsing model. Hieronder vindt u een lijst van deze verbeteringen samen met de overige verbeteringen die deze release met zich meebrengt.
Verbeteringen aan bestaande cv parsing modellen
Verbeteringen aan het Engelse model:
- Een accuratere segementatie en extractie van opleidings-items
- Verbeterde herkenning en parsing van Amerikaanse adressen
- Betere extractie van taalvaardigheden en het bijbehorende niveau
Verbeteringen aan andere talen:
- Betere extractie van nationaliteiten in Duitse cv’s
- Verfijndere extractie van namen in Tsjechische cv’s
Verbeterde extractie van emails met een plus-teken voor alle talen
Kandidaten passen soms hun emailadres aan (bijv xyz+info@voorbeeld.nl), om een bepaalde correspondentie bij te houden en filters in hun mailbox op te zetten. De emailadressen xyz@voorbeeld.nl en xyz+info@voorbeeld.nl werken allebei, omdat het plus-teken automatisch wordt genegeerd. Alle cv parsers van Textkernel zijn nu in staat om deze emails met een plus-teken correct te extraheren.
Nieuw: normalisatie van diploma en instituut-type voor Chinees
De Chinese cv parser is nu in staat om genormaliseerde instituut-types en diploma’s uit opleidings-items te halen, zoals de tabel hieronder laat zien. Door het categoriseren van opleidingsniveau’s en school-types, kunnen recruiters gemakkelijker kandidaten met een bepaald opleidingsniveau vinden.
Voor meer informatie over deze release of over Textkernel’s cv parsers, neem contact op met Textkernel.