Online vacatures komen vaak dubbel voor. Maar hoe ontdek je ze als het geen exacte kopieën zijn?

UnbenanntVoor Jobfeed, Textkernel’s real time database voor arbeidsmarktanalyses, doorzoeken we het web naar online vacatures. Het waarborgen van de kwaliteit van deze database brengt natuurlijk veel technische uitdagingen met zich mee. Eén hiervan is het ontdekken van dubbele vacatures. In deze blogpost legt Valentin Jijkoun, Web Mining team lead, uit hoe Textkernel dit probleem oplost.

Lees het volledige artikel (EN) >>

Over de auteur
meValentin Jijkoun is the head of the Web Mining Team at Textkernel and one of the architects behind Jobfeed. He is Russian, grew up and studied in St. Petersburg, but has been living in Amsterdam “forever”. His background is in machine learning and natural language processing, and in his spare time he reads, plays piano and watches old British comedies.

Are you curious about Textkernel and the web mining team? We are growing and looking for a Software Engineer – Python and Big Data!