Posted on June 6, 2017

Nieuwe release cv- en vacatureparsing

Bij Textkernel verbeteren we onze producten continu. Daarvoor gebruiken we verschillende state-of-the-art Machine Learning technieken. Met de nieuwste release (2017.1) van Extract! hebben we onze bestaande cv- en vacatureparsingmodellen voor diverse talen verder verfijnd.

Hieronder lees je alles over de verbeteringen die deze nieuwste release heeft opgeleverd. Meer lezen over wat we doen op het gebied van research en development? Neem een kijkje op ons blog.

Extract! by Textkernel
Extract! by Textkernel

De nieuwste release van Extract! bevat de volgende verbeteringen:

Cv-parsing release:

  • Voor alle talen: de cv-parser van Textkernel berekent automatisch het aantal jaren werkervaring. Met onze nieuwste release kunnen we ook gaten in cv’s detecteren, en zo de jaren zonder werkervaring verrekenen.
  • Engels: we parsen nu ook Indeed cv’s in pdf en LinkedIn cv’s in HTML.
  • Nederlands: verbeterde herkenning van Nederlandse namen en verbeterde extractie van postcodes.
  • Frans: verbeterde parsing van Canadese cv’s (normalisatie van opleiding, parsing van adres en telefoonnummers).
  • Spaans: verbeterde extractie van adressen, data, het niveau van IT-vaardigheden en classificatie van opleidingsniveau.
  • Tsjechisch: extractie van salarissen toegevoegd.
  • Zweeds: verbeterde resultaten extractie van persoonlijke gegevens, zoals naam, adres, telefoonnummer en verbeterde classificatie opleidingsniveau.
  • Portugees: verbeterde classificatie opleidingsniveau.

Vacature-parsing release:

  • Alle talen: verbeterde classificatie van contracttypen. Om te kunnen zoeken en filteren op contracttype, zoals vast, tijdelijk, stage etc., wordt data uit vacatures gemapped naar het juiste contracttype. In onze nieuwste release is dat nog verder verbeterd.
  • Duits: verbeterde extractie van locaties in Duitsland en Oostenrijk.
  • Engels: verbeterde extractie van telefoonnummer en Amerikaanse datanotering.
  • Engels- en Franstalige vacatures: verbeterde extractie van salarissen.

Al onze SaaS-klanten profiteren automatisch van de verbeteringen. Klanten met een lokale installatie kunnen contact opnemen met ons Professional Service team. Zij kijken graag naar de mogelijkheden voor het updaten van de huidige versie van Extract!.

Heb je nog vragen naar aanleiding van deze nieuwe release? Neem contact met ons op!

Extract! is de (meertalige) parsing-tool van Textkernel. De tool extraheert automatisch gegevens uit cv’s of vacatures (cv parsing en vacatureparsing) en slaat deze gestructureerd en doorzoekbaar op in je database. Handmatige invoer van gegevens is niet meer nodig.