Die Herausforderungen bei Parsing & Matching von CVs und Jobs

Für das menschliche Auge ist es einfach einen Lebenslauf zu lesen. Die vermeintlich strukturierten Dokumenten sind klar in Bereiche definiert und haben zumeist ein Layout, das ein einfaches Erkennen der wichtigsten Faktoren vereinfacht.

Eine Maschine hingegen muss stetig weiterentwickelt werden, um verschiedenste CVs korrekt zu erkennen. Mihai Rotaru, Head of R&D bei Textkernel, erklärt in seinem englischsprachigen Blog, wie Textkernel Machine Learning Prinzipien verwendet, um mit dieser Herausforderung umzugehen und den besten Parser am Markt zu entwickeln.

Lesen Sie den gesamten Blog Beitrag auf Englisch!

About Mihai
mihaiMihai Rotaru is the Head of Research and Development at Textkernel. He is leading the main R&D team which is developing the in-house natural language processing pipeline and its instantiation for resume parsing (16 languages), job parsing (4 languages and 7 countries) and matching between jobs and people. These information extraction models are the core components of Textkernel’s product line: Extract!, Search!, Match! and Jobfeed. Originally from Romania, he joined Textkernel in 2008 after obtaining a PhD degree in Computer Science at University of Pittsburgh, USA. He is interested among others in machine learning, information extraction, deep learning and how these new technologies can be applied to industry.

Feel free to contact me with any questions. And if I have piqued your interest, come work with us, there are many openings on our jobs page ranging from internships to experienced researchers.