Posted on May 27, 2014

Innovatie in CV parsing met “Deep Learning” technologie

Deep Learning is de nieuwe innovatie in taaltechnologie en wordt ook wel de volgende stap in kunstmatige intelligentie genoemd. Deep Learning is een set algoritmes die wordt toegepast op grote hoeveelheden data om automatisch informatie te leren representeren. Voorbeelden van toepassingen zijn het automatisch leren van de betekenis van nieuwe woorden en het herkennen van vormen in afbeeldingen.

Deep Learning in NLP
3D-plot-Deep-Learning-300x263Terwijl Deep Learning uiterst succesvol is gebleken voor beeldherkenning, moeten de toepassingen in de natuurlijke taalverwerking (NLP) nog van de grond komen. Textkernel, een specialist in semantische recruitmenttechnologie, is een van de eerste bedrijven in haar gebied dat Deep Learning heeft toegepast in taaltechnologie. “Deep learning geeft ons de mogelijkheid om snel nauwkeurige modellen te ontwikkelen zonder dat hiervoor een grote hoeveelheid handmatig gelabelde informatie nodig is”, zegt Jakub Zavrel, CEO en mede-oprichter van Textkernel. “Terwijl onze huidige cv parsing modellen gemiddeld al een zeer hoge nauwkeurigheid bieden, kan Deep Learning helpen de herkenning nog robuuster te maken en nog betere resultaten te boeken bij de moeilijke gevallen.

Google en Facebook
Bedrijven als Google en Facebook hebben enorme vooruitgang geboekt met ‘Deep Learning’-technologie. Google’s systeem (“Google Brain“) heeft geleerd om op basis van miljoenen documenten automatisch een kat te herkennen, zonder hiervoor te zijn getraind. Deep-learning onderzoekers van Facebook hebben onlangs gezichtsverwerking-software gepresenteerd, dat bijna het menselijk handelen evenaart.

Veelbelovende resultaten
In het geval van natuurlijke taaltechnologie, ziet de toepassing van Deep Learning er ook veelbelovend uit. In de eerste fase van haar onderzoek, heeft Textkernel al significante verbeteringen behaald in de nauwkeurigheid van de Engelse en Franse parsingmodellen. Deze zijn inmiddels geïntegreerd in de nieuwste cv parsing release. “Deep Learning bevrijdt ons van de beperkingen in het gebruik van door mensen geannoteerde data in onze machine learning pijplijn”, zegt Mihai Rotaru, hoofd R&D bij Textkernel. “Nieuwe kennis wordt afgeleid uit grote hoeveelheden ruwe gegevens en we hebben al gezien dat dit de robuustheid en dekking van onze cv parsing verhoogt”.

Big data en computerkracht
Hoewel de toekomst van Deep Learning technologie er goed uit ziet, was dit niet altijd het geval. “20 jaar geleden experimenteerden we al met deze technologie, maar andere technieken werkten destijds beter”, legt Remko Bonnema, technisch directeur en mede-oprichter van Textkernel, uit. “Met de huidige toegang tot big data en de enorme toename van computerkracht, heeft de toepassing van Deep Learning technologie een grote vlucht genomen. De mogelijkheden zijn nu eindeloos.

Lees meer over Deep Learning

Over Textkernel:
Textkernel specialiseert zich in semantische recruitment-technologie en levert recruiting-tools om het matchen van vraag en aanbod in de arbeidsmarkt te versnellen: meertalige cv parsing, vacatureparsing en semantische searching-, sourcing- en matching-software. Textkernel is opgericht in 2001 als een private commerciële R&D spin-off van onderzoek in Natural Language Processing en Machine Learning aan de Universiteiten van Tilburg, Antwerpen en Amsterdam. Met duizenden klanten wereldwijd opereert Textkernel als één van de marktleiders in haar segment.
www.textkernel.nl