Textkernel neemt Amerikaans AI-softwarebedrijf Sovren over

Amsterdam, 30 November 2021 – HR-softwarespecialist Textkernel neemt het Amerikaanse Sovren over, een softwarebedrijf gespecialiseerd in artificiële intelligentie voor recruitment. Textkernel bevestigt hiermee haar positie als wereldwijde marktleider op het gebied van zoek- en matchtechnologie. De overname wordt gesteund door software-investeerder Main Capital Partners.

Sovren is voornamelijk actief in de Noord-Amerikaanse markt en opereert vanuit Texas in de Verenigde Staten, met een productportfolio dat vergelijkbaar is aan de suite van Textkernel. De uitbreiding sluit naadloos aan op de missie van Textkernel om mensen en banen beter met elkaar te willen verbinden.

Met deze strategische stap zet Textkernel haar succesvolle groeitraject voort en versterkt zij haar positie in de Noord-Amerikaanse markt en APAC-regio. Textkernel en Sovren hebben beide een indrukwekkende groei doorgemaakt de afgelopen jaren, zowel binnen als buiten de Verenigde Staten. Na het bundelen van de krachten met Sovren, bedient Textkernel meer dan 2.500 klanten, waaronder enkele van de grootste uitzendbureaus wereldwijd, vanuit kantoren in Nederland, de Verenigde Staten, Frankrijk en Duitsland.

Connecting People and Jobs, Better

“Met de overname van Sovren gaat Textkernel een spannende nieuwe fase in van haar 20-jarig bestaan, als wereldwijd marktleider in AI-technologie voor werving en selectie. Sinds onze oprichting als onderzoeksbedrijf 20 jaar geleden, heeft Textkernel de ambitie om mensen en banen beter met elkaar te verbinden.”

Door de toevoeging van Sovren is Textkernel een stap dichter bij het creëren van een AI-platform dat HR- en arbeidsmarktdata op een zinvolle en effectieve manier wereldwijd toegankelijk maakt.

Gerard Mulder, CEO van Textkernel

Robert Ruff, CEO van Sovren, voegt toe: “Ik ben erg blij dat we het best mogelijke bedrijf voor Sovren gevonden hebben om de krachten mee te bundelen. Deze overname zorgt voor continuïteit voor onze medewerkers, onze klanten en onze producten. Ik ben ervan overtuigd dat de klanten van Sovren direct kunnen profiteren van de expertise en functionaliteiten van Textkernel op het gebied van classificering van  competenties en beroepen en semantische verrijking van zoek- en matchresultaten.”

Pieter van Bodegraven, Managing Partner Benelux bij Main en voorzitter van de Raad van Commissarissen van Textkernel: “We verwachten op korte tot middellange termijn actiever te worden in de Verenigde Staten. Dit is een zeer spannend moment voor Main, omdat we voor veel van onze Europese platformbedrijven een groot potentieel zien om via een buy-and-build strategie de activiteiten in de Verenigde Staten uit te breiden.”

Over ons

Textkernel

Textkernel is de internationale leider in Artificial Intelligence (AI), Machine Learning en Semantische Technologie voor het matchen van mensen en banen. Textkernel stelt duizenden werving- en selectiebureaus, werkgevers, vacaturesites, HR-softwareleveranciers en detacheringsbureaus wereldwijd in staat om slimmer en effectiever te werken, door het HR- en recruitmentproces efficiënter te maken. Textkernels hoofdkantoor staat in Amsterdam, daarnaast voert zij vestigingen in Duitsland, Frankrijk, het Verenigd Koninkrijk en de Verenigde Staten. Inclusief Sovren heeft de groep ca. 140 mensen in dienst. In november 2021 behaalde Textkernel de eerste plaats in de Main Software 50, de ranglijst voor de meest succesvolle softwarebedrijven in Nederland.

Main Capital Partners

Main Capital Partners is een strategische investeerder met een exclusieve focus op enterprise software. Main heeft bijna 20 jaar ervaring met het bouwen van sterke softwaregroepen in de Benelux, de DACH-regio en Scandinavië. Main is strategisch partner voor managementteams van softwarebedrijven, met als doel om in nauwe samenwerking duurzame groei te realiseren. Met een team van 45 medewerkers op locaties in Den Haag, Stockholm en Düsseldorf, biedt Main zijn portfoliobedrijven strategisch advies en pragmatische ondersteuning. Per oktober 2021 heeft Main Capital Partners circa 2,2 miljard euro onder beheer.

Sovren

Sovren Inc.  is een wereldwijd toonaangevende leverancier van enterprise software voor cv-extractie en semantische matching / Artificial Intelligence matching (AIM). Sovren bedient een klantenbestand dat 1.000 recruitmentbedrijven, HR-softwareleveranciers, job boards en grote bedrijven omvat. Sovrens brede suite van intuïtieve, accurate en zeer efficiënte recruitmentoplossingen wordt gebruikt door klanten over de hele wereld in meer dan 70 landen. Het bedrijf wordt geleid door oprichter en directeur Robert Ruff. Alle medewerkers werken vanuit de Verenigde Staten.

Perfecte klant-kandidaat matches creëren? Echt doelgericht pitchen bij een potentiële klant? Weten welke softskills en culturele aspecten in een specifieke job markt populair zijn?

Het koppelen van een goede kandidaat aan de juiste organisatie is steeds belangrijker. De juiste softskills, overeenkomende waarden en een culturele match – werkzoekenden hechten hier steeds meer waarde aan. Met de recruitment datatool Jobfeed krijg je, naast leadgeneratie, ook uitgebreid inzicht in de markt, cultuur en gevraagde softskills binnen een bepaalde branche of specifieke organisatie. Maar hoe doe je dat?

Tijdens dit webinar leer je aan de hand van voorbeelden creatief omgaan met Jobfeed. We laten je zien hoe je de juiste data verzamelt en hoe je inzichten daaruit direct kunt gebruiken . Zo haal jij meer uit de tool, krijg je inzicht in de arbeidsmarkt en ontstaan er betere matches. Dit bespaart tijd én geld!

Opgenomen op 10 augustus 2021 | 30 minuten

Wil jij

Leren hoe je Jobfeed creatief inzet voor gericht resultaat
– Betere culturele matches voordragen
– Meer inzicht in veel gevraagde vaardigheden en skills
– Optimale vacatureteksten aanleveren die inspelen op de juiste soft skills
– Doelgericht pitchen op de bedrijfscultuur van een potentiële klant

Zo werkt Jobfeed van Textkernel

In 2003 is Textkernel gestart met het aggregeren van vacature-informatie voor matching-en analysedoeleinden onder het label ‘Jobfeed’. Vandaag de dag is Jobfeed naast Nederland beschikbaar in België, Canada, Duitsland, Frankrijk, Italië, Oostenrijk, Spanje, Verenigd Koninkrijk en de Verenigde Staten en is Textkernel marktleider in dit domein. Dankzij haar sterke technologische basis en kennis van het domein, heeft Textkernel een unieke bron van arbeidsmarktgegevens gecreëerd die gebruikers inzicht geeft in de trends en ontwikkelingen in de vraagzijde van de arbeidsmarkt.

De unieke aspecten van Jobfeed:

  • Een zeer groot aantal bronnen (vele tienduizenden websites) die dagelijks gespiderd worden
  • Gedetailleerde verrijking op de vacature-informatie, dat het gebruik van vele zoekcriteria mogelijk maakt, ongeacht de structuur van de originele vacaturetekst.
  • Hoge kwaliteit en betrouwbaarheid van het ontdekkings- en extractieproces door jarenlange ervaring
  • Accurate ontdubbeling van vacatures
  • Codering van beroepen en andere criteria naar klantspecifieke taxonomieën
  • Op maat gemaakte rapportages
  • Een ongekende historie aan vacaturedata voor analyse-doeleinden en de capaciteit om deze vacatures naar nieuwe inzichten analyseerbaar te maken.

Jobfeed biedt de mogelijkheid om een bijna real-time beeld van de arbeidsmarkt te schetsen en trendanalyse te maken op basis van historische data uit deze grote vacaturedatabase.

Het Jobfeed-proces

Jobfeed doorzoekt dagelijks het internet naar nieuwe vacatures via een geautomatiseerd proces. Gevonden vacatures worden automatisch geëxtraheerd, gecategoriseerd en opgenomen in de Jobfeed-database. Het volgende diagram geeft een schematische weergave hiervan.

Het-Jobfeed-proces

In meer detail, bestaat Jobfeed uit de volgende modules:

Spidering

Jobfeed verkrijgt dagelijks nieuwe vacatures van het Internet door middel van spidering. Om brede en diepe dekking te bereiken, hanteert Jobfeed twee spidermethoden: brede spidering en doelgerichte spidering.
De brede spider is een systeem dat automatisch en dynamisch werkt. Het doorzoekt continue honderdduizenden relevante (bedrijfs)websites en ontdekt nieuwe vacatures.

Doelgerichte spider-scripts worden ingezet om vacatures van specifieke, meestal grote, websites op te halen. Hieronder vallen vacaturebanken en websites van grote werkgevers. Ondanks hun grootte en complexiteit zorgt het spiderscript ervoor dat alle vacatures worden gevonden. De doelgerichte scripts draaien meerdere keren per dag.

Daarnaast zoekt Jobfeed in Twitter naar links die naar vacatures leiden (op dit moment alleen in Nederland).

Websites die alleen vacatures van andere sites kopiëren of doorplaatsen (de zogenaamde aggregators) zijn uitgesloten van Jobfeed, omdat Jobfeed al de originele vacatures indexeert. Bovendien verliezen de aggregatoren vaak belangrijke vacature-informatie of interpreteren dit verkeerd, wat resulteert in slechte kwaliteit.

Classificatie

Het classificeren houdt in dat wordt vastgesteld of een opgehaalde webpagina een vacature is of niet. Door middel van geavanceerde taaltechnologie en het gebruik van tekstuele kenmerken op de pagina, bepaalt Textkernel’s algoritme of een pagina moet worden verwerkt. Deze classificatie is afgestemd op het accepteren van zoveel mogelijk vacatures en tegelijkertijd het weggooien van zoveel mogelijk pagina’s die geen vacatures zijn.

Classificatie is alleen noodzakelijk voor pagina’s die afkomen van de brede spider. De doelgerichte spiders scripts halen alleen pagina’s binnen waarvan bekend is dat het vacatures zijn.

Informatie-extractie

Om de vacatures doorzoekbaar te maken, worden zij volautomatisch gestructureerd met behulp van Textkernel’s intelligente informatie-extractiesoftware. Deze software is getraind op het vinden van gegevens in vrije tekst en is dus onafhankelijk van de structuur van de tekst of de opmaak van de bron.
Het extractieproces bestaat uit twee stappen:

  • Het “schoonmaken” van de webpagina door het verwijderen van alle niet-relevante inhoud (zoals menu’s en formulieren). Op deze manier blijft alleen de werkelijke vacaturetekst over. In het geval van pdf’s is deze stap niet van toepassing.
  • Het extraheren en valideren van meer dan 30 velden uit de vacaturetekst, zoals de vacaturetitel, standplaats, opleidingsniveau en organisatie.

Normalisatie en verrijking

Normalisatie houdt in dat geëxtraheerde gegevens gecategoriseerd worden volgens een standaardindeling. Dit maak het eenvoudiger om de gegevens te doorzoeken en om analyses op te doen. Normalisatie vindt plaats bij velden als beroepen, opleidingsniveaus en organisaties.

Een voorbeeld: het normaliseren van beroepen gebeurt met behulp van een codetabel. Dit is een hiërarchische structuur dat bestaat uit hoofdcodes (referentieberoepen) met synoniemen. De geëxtraheerde vacaturetitel wordt gematcht naar een van de synoniemen. De match hoeft niet exact te zijn. De vacature zal gekoppeld worden aan het meest vergelijkbare beroep. Wanneer gezocht wordt naar vacatures van een bepaald beroep, worden alle vacatures gevonden die matchen met een van de synoniemen van dat beroep.

Verrijking wordt gedaan in het geval van organisaties. De geëxtraheerde contactinformatie van de vacature wordt gebruikt om de betreffende record in een nationale bedrijfsdatabase te vinden (zoals de Kamer van Koophandel-tabel in Nederland). Omdat informatie in de vacatures vaak schaars is, wordt een techniek genaamd ‘fuzzy matching’ gebruikt. Met deze techniek kan Jobfeed de juiste organisatie vinden, ongeacht verschillen in spelling van de organisatienaam, adres of in het geval van onvolledige informatie. Vanuit de bedrijfsdatabase kan andere informatie worden afgeleid, zoals het aantal werknemers, de primaire activiteit en de volledige contactgegevens van de organisatie.

Ontdubbeling

Vacatures worden vaak op meerdere websites geplaatst, of meerdere keren op dezelfde website. Ontdubbeling wordt gedaan door een nieuwe vacature te vergelijken met alle vacatures die door Jobfeed in de afgelopen zes weken zijn gevonden.

Twee vacatures die dubbelen zijn van elkaar, zijn vaak niet identiek. Ontdubbeling vereist daardoor een verfijnde aanpak. Zoals bij classificatie en extractie, wordt bij de ontdubbeling ook een machine learning algoritme toegepast. Om te bepalen of twee vacatures dubbelen van elkaar zijn, worden de vacatureteksten en belangrijke kenmerken van de vacatures vergeleken, zoals vacaturetitel, standplaats en adverteerder.

Dubbele vacatures worden niet weggegooid, maar bewaard in Jobfeed. Op die manier is uit Jobfeed af te leiden hoeveel unieke vacatures er zijn, maar ook hoeveel vacatureplaatsingen er zijn geweest.

Verlopen vacatures

De originele bron van elke vacature wordt regelmatig bezocht om te checken of de vacature nog steeds actief is. ‘Verlopen’ betekent dat de vacature niet meer direct beschikbaar is vanaf de originele URL, of dat de vacature door een normale bezoeker niet meer kan worden opgevraagd vanaf de homepage van de originele website. De verloopdatum wordt opgeslagen in de Jobfeed-database.

Kwaliteitscontrole

Automatische processen voor spidering, extractie, classificatie en normalisatie zijn de enige kosteneffectieve manier om een maximaal potentieel uit online vacature-informatie te realiseren. Deze processen zijn echter niet foutloos. De kwaliteit van de Jobfeed-data wordt continu bewaakt en verbeterd. Dit wordt gedaan door een combinatie van automatische meldingen en handmatige kwaliteitscontroles.
Voor meer informatie over Jobfeed, neem contact op met Textkernel via info@textkernel.nl.

Over Textkernel

Jobfeed is een product van Textkernel BV. Textkernel specialiseert zich in semantische recruitment-technologie en levert recruiting-tools om het matchen van vraag en aanbod in de arbeidsmarkt te versnellen: meertalige cv parsing, vacatureparsing en semantische searching-, sourcing- en matching-software.

Textkernel is opgericht in 2001 als een private commerciële R&D spin-off van onderzoek in Natural Language Processing en Machine Learning aan de Universiteiten van Tilburg, Antwerpen en Amsterdam. Met duizenden klanten wereldwijd opereert Textkernel als één van de marktleiders in haar segment.