De uitdagingen bij het parsen en matchen van cv’s en vacatures

Een cv of vacature met het blote oog aflezen is een gemakkelijke taak. Deze deels-gestructureerde documenten zijn doorgaans opgedeeld in paragrafen en hebben een layout die het eenvoudig maakt om snel belangrijke informatie te herkennen.

Een computersysteem dat cv’s ontleedt, dient daarentegen continu getraind en aangepast te worden om met de eindeloze uitdrukkingskracht van de menselijke taal om te kunnen gaan. Mihai Rotaru, Head of R&D bij Textkernel, vertelt in zijn blogpost hoe Textkernel Machine Learning toepast om hiermee om te gaan en zo de beste parser op de markt te ontwikkelen.

Lees het volledige artikel (EN) >>

Over de auteur
mihaiMihai Rotaru is the Head of Research and Development at Textkernel. He is leading the main R&D team which is developing the in-house natural language processing pipeline and its instantiation for resume parsing (16 languages), job parsing (4 languages and 7 countries) and matching between jobs and people. These information extraction models are the core components of Textkernel’s product line: Extract!, Search!, Match! and Jobfeed. Originally from Romania, he joined Textkernel in 2008 after obtaining a PhD degree in Computer Science at University of Pittsburgh, USA. He is interested among others in machine learning, information extraction, deep learning and how these new technologies can be applied to industry.

Feel free to contact me with any questions. And if I have piqued your interest, come work with us, there are many openings on our jobs page ranging from internships to experienced researchers.