
Als lid van het Textkernel-team kondig ik vol enthousiasme onze overname van Joboti aan. Dit in Amsterdam gevestigde bedrijf levert innovatieve technologie op het gebied van candidate engagement. Deze overname vormt de volgende belangrijke stap in de wereldwijde buy-and-build-strategie van Textkernel, zodat we onze klanten nog meer waarde kunnen bieden.
Gerard Mulder, CEO of Textkernel

Door deze overname komen twee organisaties bij elkaar die beide inzetten op naadloze, geautomatiseerde en schaalbare oplossingen voor recruiters en sourcingprofessionals. De geavanceerde parsing- en matchingtechnologie van Textkernel in combinatie met de innovatieve candidate engagement-technologie van Joboti verschaft recruiters een krachtig platform om met minimale inspanningen de juiste kandidaten te vinden en te benaderen.
Momenteel moeten recruiters de juiste kandidaten vinden via een grotendeels handmatig proces en hen daarna via sociale media, e-mail of chatberichten benaderen om erachter te komen of ze beschikbaar en geïnteresseerd zijn. Met behulp van onze gecombineerde technologieën kunnen recruiters echter snel geschikte kandidaten vinden via AI-gedreven matchtechnologie en contact zoeken met de kandidaten die over de juiste skills beschikken en die hun interesse, beschikbaarheid en aanvullende competenties aangegeven hebben en zelfs screeningsvragen beantwoord hebben.
Bovendien kunnen recruiters dankzij de integratie van de technologie van Joboti in onze oplossingen communicatieworkflows in het recruitmentproces automatiseren, waaronder jobalerts, AVG-checks, prescreenings, planning van gesprekken en feedbackberichten. Dit stroomlijnt het interactieproces met kandidaten, waardoor recruiters de handen vrij hebben voor werkzaamheden zoals het persoonlijk contact leggen met beschikbare kandidaten.
Onze klanten kunnen de komende maanden en jaren nog meer innovatieve functionaliteiten en producten tegemoetzien. Onze AI-gedreven recruitmentoplossingen in combinatie met de technologie van Joboti bieden geavanceerde tools voor de interactie met kandidaten die het recruitmentproces verbeteren en de time-to-hire verkorten. Omdat recruiters door deze tools in staat zijn om de records van kandidaten up-to-date te houden en zich alleen op beschikbare en geïnteresseerde kandidaten te richten, kunnen ze voor een positieve kandidaatervaring zorgen.
Wij blijven vol overgave innoveren en de recruitmentsector naar een hoger niveau tillen. De overname van Joboti versterkt onze toonaangevende positie op het gebied van AI-gedreven recruitmentoplossingen. Textkernel verwelkomt het team van Joboti dan ook met open armen. Samen gaan we nog meer innovatieve recruitmentoplossingen creëren die de sector ingrijpend zullen veranderen en onze klanten in staat stellen om hun recruitmentdoelen nog efficiënter en eenvoudiger te realiseren.
Voor meer informatie, zie onze FAQ over de acquisitie.
Over Joboti
Joboti is een start-up die gespecialiseerd is in technologie op het gebied van geautomatiseerde candidate engagement die gepersonaliseerde aanbevelingsbrieven, ondersteuning en feedback aan werkzoekenden biedt en daardoor garant staat voor een intuïtievere en gebruiksvriendelijkere ervaring. De oplossingen van Joboti verbeteren het recruitmentproces, verhogen de efficiency van HR-professionals en recruiters en verminderen hun workload. De technologie van Joboti wordt door steeds meer bedrijven wereldwijd gebruikt en wordt gewaardeerd om haar innovatieve benadering van recruitment.


Met de toenemende war on talent is een hoog doorplaatsingspercentage een belangrijk doel voor uitzendbureaus die zich bezighouden met flexwerk. In hun systemen ontbreekt echter vaak kennis over de beschikbaarheid van kandidaten en de geschiktheid voor de functie. Met de overname van Akyla dicht Textkernel deze kenniskloof. In dit blog leest je welke voordelen de overname heeft en wat je in de toekomst van de samenwerking kunt verwachten.
In juni 2022 nam Textkernel het softwarebedrijf Akyla over. Akyla is een Nederlands bedrijf dat bekend staat als leverancier van midoffice oplossingen voor geautomatiseerde doorplaatsing, efficiënt beheer van flexwerkers, tijdmanagement en documentverwerking.
Uitzendorganisaties hebben momenteel te maken met een groot tekort aan kandidaten. Deze situatie wordt de komende jaren nog uitdagender door demografische veranderingen. Daardoor wordt werving steeds kostbaarder en tijdrovender. Uitzendbureaus zijn daarom gebaat bij een hoog doorplaatsingspercentage om tijdrovende wervingsprocessen te voorkomen. Cruciale informatie over de beschikbaarheid van kandidaten ontbreekt echter vaak in de frontofficesystemen waar de werving plaatsvindt.
De juiste data voor slimme zakelijke beslissingen
Textkernel’s overname van Akyla betekent dat uitzendbureaus data kunnen omzetten in kennis voor slimmere zakelijke beslissingen. De midoffice softwareoplossingen van Akyla helpen klanten bij het automatiseren van repetitive taken zoals onboarding, urenregistratie, tijdsinterpretatie, digitale ondertekening en leveranciersbeheer. De software verbindt front- en backofficesystemen en geeft via een app directe toegang tot zowel kandidaten als werkgevers. Zo is voor iedereen zichtbaar wanneer een opdracht afloopt en een kandidaat beschikbaar is.
Op basis van deze gegevens zullen klanten die Akyla en Textkernel gebruiken in de toekomst van matchingsresultaten profiteren die beter zijn afgestemd op hun processen en de beschikbaarheid van kandidaten. Zij kunnen kandidaten op het juiste moment nieuwe kansen bieden, de retentie verhogen en herhaling van de kosten- en tijdsintensieve wervings-, interview-, selectie- en onboardingprocessen voorkomen.
Door de combinatie van de beste matching engine en het beste midoffice systeem, ontstaat een positief effect op de betrokkenheid en ervaring van kandidaten. Dat betekent een lager verloop, een hogere bezettingsgraad, lagere kosten per werving en een kortere time-to-hire. Naast uitzendbureaus zullen ook kandidaten profiteren van een betere doorplaatsing: het financiële risico en de onzekerheid verminderen. Dat resulteert in een beter imago voor de uitzendbureaus.

Het einde van 2022 nadert snel. Opkomende trends, verwachtingen van kandidaten, concurrerende vacatures en datagestuurde capaciteiten hebben HR-professionals meer uitdagingen en kansen gecreëerd dan ooit tevoren. Om de ontwikkelingen in de markt bij te benen en snel geïnformeerde beslissingen te nemen, heeft men tools nodig om talent- en arbeidsmarktgegevens bruikbaar te maken en in te zetten. Dit vereist voortdurende productinvesteringen en -verbeteringen. We zijn verheugd om 2022 af te sluiten met het delen van Textkernel’s recente en aankomende productverbeteringen, zodat u mensen en vacatures beter kunt begrijpen, verbinden en analyseren.
Begrijpen – vastleggen en behouden van een actueel beeld van het talent landschap
Het begint allemaal met het verwerken en begrijpen van ongestructureerde kandidaat informatie en documentatie tot gestructureerde gegevens die kunnen worden gebruikt om kandidaat informatie te filteren, te doorzoeken en te rangschikken. Met onze CV Parser tool kunt u de verwerking van kandidaatgegevens automatiseren voor een sneller, efficiënter en nauwkeuriger proces. Wat is er nieuw…?
- We ondersteunen nu maar liefst 25 talen voor gegevensextractie met een hoog nauwkeurigheidsniveau. Onze meest recente taal toevoegingen zijn Chinees en Hebreeuws
- We hebben de nauwkeurigheid van de parsing aanzienlijk verbeterd; de laatste verbeteringen omvatten cv’s uit Roemenië, Colombia, Brazilië en Portugal. Bekijk onze testresultaten in vergelijking met onze concurrenten.
- In plaats van één grote lijst met vaardigheden, zie je nu de vaardigheden gekoppeld aan de werkgeschiedenis, waardoor de relevantie van de vermelde vaardigheden wordt vergroot.
- Door de upgrade naar Skills Parsing Framework Version 2, profiteren alle klanten van 80% meer extracted vaardigheden, tot 20% minder ruis , automatische toekomstige updates en vaardigheid normalisatie.
Gegevens over mensen en banen zijn vaak rommelig: vaardigheden en functietitels kunnen op verschillende manieren worden verwoord en informatie kan in verschillende bronnen en/of formaten zijn opgeslagen. Textkernel’s Data Enrichment APIs helpen bij het standaardiseren en verrijken van functie- en vaardigheid gegevens bij het parsen van een CV/Vacature. Wat is er nieuw…?
- We hebben 9 nieuwe talen toegevoegd aan de vaardigheden taxonomie !
- De beroepen taxonomie is geüpgrade met O*NET 2019 en lokale taxonomieën in Duitsland, het Verenigd Koninkrijk en Nederland, om u te ondersteunen bij de naleving van lokale regelgeving.
Verbinden – gebruik data om mensen en banen beter te matchen
Onze Search! & Match! tools bespaart je uren bij het vinden en rangschikken van de juiste kandidaten bij vacatures en vice versa. Benut de waarde van je interne database en/of voer een enkele zoekopdracht uit op meerdere externe bronnen. Met een enkele klik kan een geautomatiseerde zoekopdracht worden aangemaakt, gebaseerd op een profiel dat is gematcht met interne vacatures of gematcht met vacatures van directe werkgevers op de markt via Jobfeed. Wat is er nieuw…?:
- Het vinden van vergelijkbare kandidaten (kandidaat-tot-kandidaat-matching) is opgefrist en verbeterd.
- Matching is nog nauwkeuriger met een focus op specifieke aspecten van de kandidaat. In onze dynamische templates is het nu mogelijk om voorkeurs vragen te genereren. Zo is opleiding erg belangrijk voor pas afgestudeerden, terwijl het minder belangrijk is bij het zoeken naar zeer ervaren kandidaten.
- Bulkacties op een grote hoeveelheid zoek- of match resultaten zullen binnenkort veel gemakkelijker uit te voeren zijn!
- ‘Source’ is ons nieuwe, stand-alone en vereenvoudigde product voor het doorzoeken van meerdere externe kandidaten databases.
- Met Private Data Analytics kunt u uw privégegevens eenvoudig vergelijken met de markt. Gegevens uit je Textkernel Search-index ,met verrijkte en genormaliseerde gegevens uit onze taxonomieën, kun je in je datawarehouse laden om gemakkelijker te analyseren.
- Binnenkort kunnen web-profielen met één klik worden geïmporteerd via onze browserextensie.
Om je nog meer tijd te besparen, lanceren we binnenkort een nieuwe Automation-API die automatisch lijsten met passende kandidaten en vacatures binnen je ATS aanmaakt. Deze lijsten kunnen worden opgepikt door recruiters of ATS-automatisering om in contact te komen met potentiële kandidaten. Meer informatie en use cases volgt in het nieuwe jaar.
Analyseren – maak data toegankelijk om strategieën te ontwikkelen op individueel en organisatieniveau
De enige manier om concurrentie voor te blijven in een competitieve markt, is door sneller te reageren. Jobfeed biedt realtime marktinzichten waarmee je groeimogelijkheden kunt identificeren, jezelf kan onderscheiden van de concurrentie en tijd en moeite kunt besparen. Jobfeed voorziet je van uitstekende marktkennis, informatie over concurrenten en geeft inzicht in snel veranderende trends . Wat is er nieuw…?
- We verbeteren voortdurend onze gegevens nauwkeurigheid, de nieuwste nauwkeurigheid updates omvatten salarissen en locaties.
- Jobfeed is nu beschikbaar voor 11 landen met onze nieuwste aanwinst, Zwitserland.
- We zijn nog niet klaar met het toevoegen van landen : Australië, Nieuw-Zeeland en Japan staan op de roadmap.
- Betere weergave en meer gebruiksvriendelijkheid met onze markdown-opmaak
- De nieuwe en verbeterde gebruikersinterface van Jobfeed is bijna klaar!
We werken samen met de besten in de branche
Meer dan honderd partners over de hele wereld bieden Textkernel’s state-of-the-art AI-aangedreven technologie aan, van lokale marktleiders tot grote internationale spelers zoals Salesforce, Bullhorn, SAP, Cornerstone en Oracle. En we breiden ons ecosysteem voortdurend uit. Met trots delen we enkele belangrijke verbeteringen in onze Salesforce-connector ;
- Geïmplementeerde ondersteuning functie zodat u eenvoudig externe kandidaten kunt vinden en importeren in Salesforce
- Widgets om de beste matches binnen Salesforce direct naast de kandidaat of vacature weer te geven
- U kunt Jobfeed-leads nu eenvoudig importeren in Salesforce
We hopen dat je ons enthousiasme over deze product verbeteringen deelt! Voel je,je gemotiveerd en geïnspireerd om je strategie voor het werven van talent voor het komende jaar te ontwikkelen? Lees onze blog met 4 tips voor 2023.
Proost op een succesvol 2023!


Met de huidige krapte word je eigen database steeds belangrijker. Toch halen nog lang niet alle (uitzend)organisaties eruit wat erin zit, zien Arjan van der Vecht en Ton Sluiter (Textkernel). Hoe kun je dat volgens hen wél verbeteren?
Je eigen database met kandidaten? Het lijkt er soms op of uitzendbureaus of andere staffers hem helemaal links laten liggen, en vooral ‘buiten’ proberen naar kandidaten te zoeken. Ten onrechte, stellen Ton Sluiter en Arjan van der Vecht. ‘In je eigen database zit het ware goud van je organisatie’, aldus Sluiter. ‘We horen steeds vaker van klanten dat hen reactiveren de meest succesvolle manier is om te sourcen. Het gaat er alleen om: hoe doe je dat dan? Hoe ontdek je hier de pareltjes?’
‘Klanten zeggen steeds vaker dat hun database reactiveren de meest succesvolle manier is om te sourcen.’
Van der Vecht vult aan: ‘Automation kan je hier op een aantal manieren bij helpen. Bijvoorbeeld door de profielen in je database automatisch te laten verrijken, door snel de best passende kandidaten te vinden in je eigen database en door de engagement van de kandidaten te verhogen, bijvoorbeeld door vacaturemeldingen te automatiseren. Er zijn bovendien tegenwoordig steeds betere user interfaces om je eigen database te doorzoeken. Semantisch bijvoorbeeld, zoals wij dat doen, zodat je als je een loodgieter zoekt ook meteen alle aanverwante functies boven krijgt.’
Findability
Sluiter en Van der Vecht vertellen er graag meer over, op maandag 14 februari, tijdens Werf& webinar in de Webinar Week. Je eigen database is volgens hen namelijk een heel belangrijke bron in tijden van krapte. ‘Voor heel wat staffingbureaus zijn het de laatste maanden toptijden geweest, met dank aan de GGD’, zegt Sluiter bijvoorbeeld. ‘Dan zie je dat nabellen van kandidaten eenvoudig niet meer te doen is. Automation kan dan helpen, om hen te matchen en aan te schrijven.’

‘Iedereen spreekt nu over de war for talent. Maar in feite zie je dat ze allemaal op zoek zijn in dezelfde vijver’, aldus Van der Vecht. ‘De gemiddelde kandidaat krijgt inmiddels behoorlijk wat verzoeken om contact op te nemen met een recruiter. Wij zeggen dan: beste staffer, je hebt een behoorlijk waardevolle database, waar je behoorlijk wat energie en geld in hebt geïnvesteerd. Gebruik die dan zo goed mogelijk. Zorg voor goede findability in die database, bijvoorbeeld met een deep learning-oplossing met semantische zoeklagen.’
Meer effectiviteit en productiviteit
Continu zelf op zoek naar passende kandidaten? Volgens Van der Vecht is het tegenwoordig grotendeels te automatiseren. ‘Door bijvoorbeeld alerts te krijgen als in een bepaalde bron een bepaalde kandidaat zich aanbiedt die matcht op jouw zoekopdracht. Zo kun je als recruiter je effectiviteit en productiviteit verhogen, en krijg je meer ruimte om daadwerkelijk te communiceren met de kandidaat en de opdrachtgever. Dat verhoogt de loyaliteit aan beide kanten.’

‘Als recruiter krijg je zo meer ruimte om te communiceren met de kandidaat en de klant.’
Volgens Sluiter kan deze ontwikkeling zelfs leiden tot een soort ‘omgekeerd recruitment’. ‘Als je alleen maar uitgaat van vacatures die je aangeboden krijgt, krijg je allemaal vacatures voor mensen die er niet of nauwelijks zijn. Waarom gaan we niet wat vaker uit van de kandidaat in de database, en zoeken daar de best passende functie bij? Onze tool Jobfeed biedt daar bijvoorbeeld een oplossing voor, en kan de daadwerkelijke kandidaat matchen op vacatures die in de markt beschikbaar zijn. Dan maak je veel beter gebruik van database die je met veel pijn en moeite hebt opgebouwd.’
Spelersmakelaar
Hij vergelijkt het zelf wel eens met het werk van een spelersmakelaar. ‘Behalve dan de contractonderhandelingen’, zegt hij lachend. Maar dan weer serieus: ‘Als je op een geautomatiseerde manier je kandidatendatabase redelijk up-to-date en engaged houdt, kun je er wel meer uithalen. Als je dan als recruiter een belletje met een kandidaat doet, komt dat veel warmer aan.’
‘Als je het goed doet, worden de cv’s in je database alleen maar rijker.’
Dat databases snel verouderen, zoals je vaak in de markt hoort? De twee zeggen er nauwelijks in te geloven. ‘Integendeel, als je het goed doet, worden de cv’s die erin staan alleen maar rijker. Of iemand beschikbaar is, is sowieso bijna niet boven water te halen. Dat principe moet je helemaal loslaten’, denkt Sluiter. ‘Volgens mij is iedereen in principe beschikbaar. Als je aanbod maar goed is. Ga nou niet proberen je database up-to-date te houden met informatie over beschikbaarheid. Op het moment dat je het invult is het alweer verouderd. Als je maar wel op alle andere fronten probeert je kandidaatprofielen steeds verder te verrijken. Dan krijg je vanzelf dat ze ook gaan reageren als je ze een relevant aanbod doet.’
Relevante aanbiedingen
Door engagement te realiseren, en continu bij te houden wat relevant is voor de mensen in je database, kun je leren hen passende aanbiedingen te doen. ‘In plaats van talloze nieuwsbrieven te sturen’, aldus Sluiter.

‘We hebben ruim 1,3 miljard vacatureteksten geanalyseerd, en krijgen 800 a 900 miljoen cv’s per jaar in onze database.’
En dat gaat allang niet meer alleen om matching op basis van functietitels, vult Van der Vecht aan. ‘We hebben veel nieuwe tooling op het gebied van skills. We hebben ruim 1,3 miljard vacatureteksten geanalyseerd, en parsen per jaar zo’n 800 a 900 miljoen cv’s. Nu met Sovren erbij loopt dat aantal nog verder op. Op basis van al die data kunnen we nu per functie vaststellen wat nou de meest significante skills ervoor zijn, over alle landen en alle vacatures heen. Daar kun je als recruiter vervolgens op matchen en je kandidaten op ondervragen.’
Interessante inzichten
Kandidaten zijn vaak ‘creatief in benoemen waar ze goed in zijn’, zegt Van der Vecht. ‘De gemiddelde werkgever ook.’ Maar door wereldwijd zowel cv’s als vacatures te analyseren vallen er volgens hem wel ‘heel interessante inzichten’ te ontdekken, en kun je matching steeds beter automatiseren, en een goede voorselectie van kandidaten presenteren. ‘Dan is het vervolgens alleen nog maar aan jou als recruiter om je onderscheidend vermogen te laten zien en te gaan praten met de kandidaat.’
‘Kandidaten zijn vaak creatief in benoemen waar ze goed in zijn.’
Het helpt ook om de vijver te vergroten, aldus Sluiter. ‘Dan laten wij bijvoorbeeld een wolk met skills zien. Dan zie je: deze skills worden genoemd in de vacature. Maar deze zitten erbij in de buurt, of zijn aanverwant. Als je dan daarop gaat zoeken, kom je misschien in een andere vijver terecht, en heb je sneller een kandidaat voor je opdrachtgever gevonden.’
Perfecte klant-kandidaat matches creëren? Echt doelgericht pitchen bij een potentiële klant? Weten welke softskills en culturele aspecten in een specifieke job markt populair zijn?
Het koppelen van een goede kandidaat aan de juiste organisatie is steeds belangrijker. De juiste softskills, overeenkomende waarden en een culturele match – werkzoekenden hechten hier steeds meer waarde aan. Met de recruitment datatool Jobfeed krijg je, naast leadgeneratie, ook uitgebreid inzicht in de markt, cultuur en gevraagde softskills binnen een bepaalde branche of specifieke organisatie. Maar hoe doe je dat?
Tijdens dit webinar leer je aan de hand van voorbeelden creatief omgaan met Jobfeed. We laten je zien hoe je de juiste data verzamelt en hoe je inzichten daaruit direct kunt gebruiken . Zo haal jij meer uit de tool, krijg je inzicht in de arbeidsmarkt en ontstaan er betere matches. Dit bespaart tijd én geld!

Wil jij
Leren hoe je Jobfeed creatief inzet voor gericht resultaat
– Betere culturele matches voordragen
– Meer inzicht in veel gevraagde vaardigheden en skills
– Optimale vacatureteksten aanleveren die inspelen op de juiste soft skills
– Doelgericht pitchen op de bedrijfscultuur van een potentiële klant

In 2003 is Textkernel gestart met het aggregeren van vacature-informatie voor matching-en analysedoeleinden onder het label ‘Jobfeed’. Vandaag de dag is Jobfeed naast Nederland beschikbaar in België, Canada, Duitsland, Frankrijk, Italië, Oostenrijk, Spanje, Verenigd Koninkrijk en de Verenigde Staten en is Textkernel marktleider in dit domein. Dankzij haar sterke technologische basis en kennis van het domein, heeft Textkernel een unieke bron van arbeidsmarktgegevens gecreëerd die gebruikers inzicht geeft in de trends en ontwikkelingen in de vraagzijde van de arbeidsmarkt.
De unieke aspecten van Jobfeed:
- Een zeer groot aantal bronnen (vele tienduizenden websites) die dagelijks gespiderd worden
- Gedetailleerde verrijking op de vacature-informatie, dat het gebruik van vele zoekcriteria mogelijk maakt, ongeacht de structuur van de originele vacaturetekst.
- Hoge kwaliteit en betrouwbaarheid van het ontdekkings- en extractieproces door jarenlange ervaring
- Accurate ontdubbeling van vacatures
- Codering van beroepen en andere criteria naar klantspecifieke taxonomieën
- Op maat gemaakte rapportages
- Een ongekende historie aan vacaturedata voor analyse-doeleinden en de capaciteit om deze vacatures naar nieuwe inzichten analyseerbaar te maken.
Jobfeed biedt de mogelijkheid om een bijna real-time beeld van de arbeidsmarkt te schetsen en trendanalyse te maken op basis van historische data uit deze grote vacaturedatabase.
Het Jobfeed-proces
Jobfeed doorzoekt dagelijks het internet naar nieuwe vacatures via een geautomatiseerd proces. Gevonden vacatures worden automatisch geëxtraheerd, gecategoriseerd en opgenomen in de Jobfeed-database. Het volgende diagram geeft een schematische weergave hiervan.
In meer detail, bestaat Jobfeed uit de volgende modules:
Spidering
Jobfeed verkrijgt dagelijks nieuwe vacatures van het Internet door middel van spidering. Om brede en diepe dekking te bereiken, hanteert Jobfeed twee spidermethoden: brede spidering en doelgerichte spidering.
De brede spider is een systeem dat automatisch en dynamisch werkt. Het doorzoekt continue honderdduizenden relevante (bedrijfs)websites en ontdekt nieuwe vacatures.
Doelgerichte spider-scripts worden ingezet om vacatures van specifieke, meestal grote, websites op te halen. Hieronder vallen vacaturebanken en websites van grote werkgevers. Ondanks hun grootte en complexiteit zorgt het spiderscript ervoor dat alle vacatures worden gevonden. De doelgerichte scripts draaien meerdere keren per dag.
Daarnaast zoekt Jobfeed in Twitter naar links die naar vacatures leiden (op dit moment alleen in Nederland).
Websites die alleen vacatures van andere sites kopiëren of doorplaatsen (de zogenaamde aggregators) zijn uitgesloten van Jobfeed, omdat Jobfeed al de originele vacatures indexeert. Bovendien verliezen de aggregatoren vaak belangrijke vacature-informatie of interpreteren dit verkeerd, wat resulteert in slechte kwaliteit.
Classificatie
Het classificeren houdt in dat wordt vastgesteld of een opgehaalde webpagina een vacature is of niet. Door middel van geavanceerde taaltechnologie en het gebruik van tekstuele kenmerken op de pagina, bepaalt Textkernel’s algoritme of een pagina moet worden verwerkt. Deze classificatie is afgestemd op het accepteren van zoveel mogelijk vacatures en tegelijkertijd het weggooien van zoveel mogelijk pagina’s die geen vacatures zijn.
Classificatie is alleen noodzakelijk voor pagina’s die afkomen van de brede spider. De doelgerichte spiders scripts halen alleen pagina’s binnen waarvan bekend is dat het vacatures zijn.
Informatie-extractie
Om de vacatures doorzoekbaar te maken, worden zij volautomatisch gestructureerd met behulp van Textkernel’s intelligente informatie-extractiesoftware. Deze software is getraind op het vinden van gegevens in vrije tekst en is dus onafhankelijk van de structuur van de tekst of de opmaak van de bron.
Het extractieproces bestaat uit twee stappen:
- Het “schoonmaken” van de webpagina door het verwijderen van alle niet-relevante inhoud (zoals menu’s en formulieren). Op deze manier blijft alleen de werkelijke vacaturetekst over. In het geval van pdf’s is deze stap niet van toepassing.
- Het extraheren en valideren van meer dan 30 velden uit de vacaturetekst, zoals de vacaturetitel, standplaats, opleidingsniveau en organisatie.
Normalisatie en verrijking
Normalisatie houdt in dat geëxtraheerde gegevens gecategoriseerd worden volgens een standaardindeling. Dit maak het eenvoudiger om de gegevens te doorzoeken en om analyses op te doen. Normalisatie vindt plaats bij velden als beroepen, opleidingsniveaus en organisaties.
Een voorbeeld: het normaliseren van beroepen gebeurt met behulp van een codetabel. Dit is een hiërarchische structuur dat bestaat uit hoofdcodes (referentieberoepen) met synoniemen. De geëxtraheerde vacaturetitel wordt gematcht naar een van de synoniemen. De match hoeft niet exact te zijn. De vacature zal gekoppeld worden aan het meest vergelijkbare beroep. Wanneer gezocht wordt naar vacatures van een bepaald beroep, worden alle vacatures gevonden die matchen met een van de synoniemen van dat beroep.
Verrijking wordt gedaan in het geval van organisaties. De geëxtraheerde contactinformatie van de vacature wordt gebruikt om de betreffende record in een nationale bedrijfsdatabase te vinden (zoals de Kamer van Koophandel-tabel in Nederland). Omdat informatie in de vacatures vaak schaars is, wordt een techniek genaamd ‘fuzzy matching’ gebruikt. Met deze techniek kan Jobfeed de juiste organisatie vinden, ongeacht verschillen in spelling van de organisatienaam, adres of in het geval van onvolledige informatie. Vanuit de bedrijfsdatabase kan andere informatie worden afgeleid, zoals het aantal werknemers, de primaire activiteit en de volledige contactgegevens van de organisatie.
Ontdubbeling
Vacatures worden vaak op meerdere websites geplaatst, of meerdere keren op dezelfde website. Ontdubbeling wordt gedaan door een nieuwe vacature te vergelijken met alle vacatures die door Jobfeed in de afgelopen zes weken zijn gevonden.
Twee vacatures die dubbelen zijn van elkaar, zijn vaak niet identiek. Ontdubbeling vereist daardoor een verfijnde aanpak. Zoals bij classificatie en extractie, wordt bij de ontdubbeling ook een machine learning algoritme toegepast. Om te bepalen of twee vacatures dubbelen van elkaar zijn, worden de vacatureteksten en belangrijke kenmerken van de vacatures vergeleken, zoals vacaturetitel, standplaats en adverteerder.
Dubbele vacatures worden niet weggegooid, maar bewaard in Jobfeed. Op die manier is uit Jobfeed af te leiden hoeveel unieke vacatures er zijn, maar ook hoeveel vacatureplaatsingen er zijn geweest.
Verlopen vacatures
De originele bron van elke vacature wordt regelmatig bezocht om te checken of de vacature nog steeds actief is. ‘Verlopen’ betekent dat de vacature niet meer direct beschikbaar is vanaf de originele URL, of dat de vacature door een normale bezoeker niet meer kan worden opgevraagd vanaf de homepage van de originele website. De verloopdatum wordt opgeslagen in de Jobfeed-database.
Kwaliteitscontrole
Automatische processen voor spidering, extractie, classificatie en normalisatie zijn de enige kosteneffectieve manier om een maximaal potentieel uit online vacature-informatie te realiseren. Deze processen zijn echter niet foutloos. De kwaliteit van de Jobfeed-data wordt continu bewaakt en verbeterd. Dit wordt gedaan door een combinatie van automatische meldingen en handmatige kwaliteitscontroles.
Voor meer informatie over Jobfeed, neem contact op met Textkernel via info@textkernel.nl.
Over Textkernel
Jobfeed is een product van Textkernel BV. Textkernel specialiseert zich in semantische recruitment-technologie en levert recruiting-tools om het matchen van vraag en aanbod in de arbeidsmarkt te versnellen: meertalige cv parsing, vacatureparsing en semantische searching-, sourcing- en matching-software.
Textkernel is opgericht in 2001 als een private commerciële R&D spin-off van onderzoek in Natural Language Processing en Machine Learning aan de Universiteiten van Tilburg, Antwerpen en Amsterdam. Met duizenden klanten wereldwijd opereert Textkernel als één van de marktleiders in haar segment.