Textkernel CV Parsing Release 2014.1 (featuring Deep Learning)

Kwaliteit is voor onze klanten een zeer belangrijk aspect van technologie en heeft daarom voor Textkernel een van de hoogste prioriteiten. Om de kwaliteit van de software verder te verhogen, verkent Textkernel continu nieuwe technieken om haar extractiemodellen te optimaliseren.

Textkernel’s meest recente onderzoek richt zich op de nieuwe technologie Deep Learning. Deep Learning is een set algoritmes die wordt toegepast op grote hoeveelheden data om automatisch representaties van gelijke woorden te leren. Bijvoorbeeld: In een cv extractie-systeem worden “Amsterdam” en “Eindhoven” beide gebruikt in de context van “stad”. Wanneer een nieuw woord met soortgelijke representaties als Amsterdam en Eindhoven gevonden wordt, is de kans groot dat dit nieuwe woord ook een stad is. Deep Learning maakt een cv parsing model robuuster omdat het automatisch de semantiek van nieuwe woorden kan leren.

Het cv parsing-team van Textkernel heeft baanbrekend onderzoek verricht naar het toepassen van de “Deep Learning”-technologie op haar extractiemodellen. Hoewel Textkernel aan het begin van deze cutting-edge techniek staat, zijn de resultaten op de cv-extractiemodellen veelbelovend. Met significante kwaliteitsverbeteringen in het Engelse en Franse extractiemodel, kan Textkernel met trots de Deep Learning technologie presenteren als onderdeel van haar Extract! CV Parsing 2014.1 release!

Lees de volledige Extract! CV parsing – 2014.1 release notes hieronder.

Textkernel Extract! CV parsing – 2014.1 release

  • Ondersteuning voor parsing van DoYouBuzz JSON profielen
    Dit wordt mogelijk gemaakt door de ‘Apply with DoYouBuzz’-widget. Kent u de ‘apply with-widget‘ nog? Met deze widget kunnen uw kandidaten solliciteren met het medium van hun keuze (bijvoorbeeld hun cv of hun LinkedIn, Xing, Viadeo, Google+ of Facebook-profiel). Tegelijkertijd ontvangt u hun volledige profieldetails automatisch gestructureerd in het formaat van uw database. Solliciteren met een DoYouBuzz-cv kan nu ook via de ‘apply with-widget’.
  • Verbeteringen in het parsen van PDF-bestanden met ingesloten lettertypes (OCR-ondersteuning is vereist)
    PDF-bestanden met ingesloten fonts werden voorheen vaak omgezet in vraagtekens in plaats van letters. Textkernel kan deze documenten met ingesloten lettertypes nu opsporen en met OCR verwerken (wanneer OCR ingeschakeld is in uw account). Dit verbetert de extractie en stelt u in staat om deze kandidaten beter te vinden.
  • Spaans: verbeteringen in alle velden
    In de afgelopen maanden heeft Textkernel ook succesvol onderzoek verricht naar het Spaanse taalmodel. In de 2014.1 release zijn significante verbeteringen doorgevoerd voor alle velden in het Spaanse CV, met een sterke focus op de persoons- en ervaringsvelden.
  • Engels: verbeteringen in parsing van Indiase cv’s
    Verbeteringen voor extractie van Indiaas-Engelse cv’s zijn doorgevoerd voor de volgende velden:

    • persoonlijke gegevens, vooral in naam- en adresverwerking
    • ervaringsitems waarbij een duur in plaats van een periode is opgegeven (bijvoorbeeld: 1 jaar of 2 maanden)
    • taalvaardigheden
  • Engels en Frans: verbeteringen door middel van de Deep Learning techniek
    Door de implementatie van Deep Learning, bevat de 2014.1 release belangrijke verbeteringen in het Engelse en Franse model voor alle secties.
  • Duits: verbeteringen in
    • pagina-identificatie (detecteren van cv-pagina’s in ingescande PDF-bestanden)
    • extractie van chronologische cv’s (cv’s met opleiding- en ervaringitems chronologisch samengevoegd tot één lange sectie)
    • extractie van de functietitel
  • Italiaans: verbeteringen in de verwerking van persoonlijke gegevens

Wilt u meer weten over onze CV parsing software of het zelf testen?
Neem contact met ons op voor een demo.