Qualität ist für unsere Kunden ein sehr wichtiger Aspekt von Technologie und daher von höchster Priorität für Textkernel. Um die Qualität unserer Software stetig zu verbessern, forscht Textkernel an neuen Techniken um die Extraktionsmodele zu optimieren.
Textkernels neueste Weiterentwicklung konzentriert sich auf die Technologie von Deep Learning. Deep Learning ist eine Zusammenstellung von Algorithmen, die benutzt werden, um einer großen Menge von Daten eine Darstellung von ähnlichen Wörtern zu lehren. Zum Beispiel werden in einem Lebenslauf Extraktionssystem sowohl “Berlin” als auch “Frankfurt” als “Stadt” benutzt. Wenn ein neues Wort gefunden wird mit einer ähnlichen Darstellung wie Berlin oder Frankfurt, handelt es sich wahrscheinlich auch um eine Stadt. Mit Deep Learning werden die Extraktionsmodele robuster und die Semantik neuer Wörter kann automatisch erlernt werden.
Textkernels CV Parsing Research Team hat bahnbrechende Neuerungen in der Anwendung der Deep Learning Technologie in Extraktionsmodellen erforscht. Während Textkernel gerade erst mit dieser höchst innovativen Technik startet, sind die Ergebnisse in den CV Extraktionsmodellen schon vielversprechend. Die signifikanten Qualitätsverbesserungen für das englische und französische Sprachmodel machen uns sehr stolz. Mit Freude präsentiert Textkernel deshalb Deep Learning als Teil des neues Extract! CV Parsing 2014.1 Release.
Lesen Sie alle Kommentare zum Extract! CV Parsing – 2014.1 Release untenstehend.
Textkernel Extract! CV parsing – 2014.1 release
- Support für das Parsing von DoYouBuzz JSON Profilen
Dies wird mit dem „Apply with DoYouBuzz“ – Widget möglich gemacht. Erinnern Sie sich an das ‘apply with-widget‘? Mit diesem Widget können sich Kandidaten mit dem Profil ihrer Wahl (zum Beispiel von LinkedIn, XING, Viadeo, Google+ oder Facebook) bewerben. Gleichzeitig empfangen Sie ein vollständiges und strukturiertes Profil, welches dem Format Ihrer Datenbank entspricht. Nun ist eine Bewerbung mit dem DoYouBuzz-Profil via dem „Apply-with-Widget“ auch möglich.
- Verbesserungen im Parsen von PDF-Dokumenten mit eingebetteter Schriftart (OCR Unterstützung ist erforderlich)
PDF-Dokumente mit eingebetteten Schriftarten wurden oft in Fragezeichen anstatt von Buchstaben umgewandelt. Textkernel kann diese Dokumente mit eingebetteten Schriftarten nun aufspüren und mit OCR verarbeiten (wenn OCR in Ihrem Account integriert ist). Dies verbessert die Extraktion und ermöglicht besseres Suchen und Auffinden von Kandidaten.
- Spanisch: Verbesserungen in allen Feldern
In den letzten Monaten ist es Textkernel gelungen die Forschung auch erfolgreich auf das spanische Sprachmodel auszuweiten. Im 2014.1 Release sind signifikante Verbesserungen für alle Felder von spanischen Lebensläufen durchgeführt worden, mit starkem Fokus auf persönliche Details und Berufserfahrung.
- Englisch: Verbesserungen im Parsing von indischen Lebensläufen
Verbesserungen im Parsen von indischen Lebensläufen wurde für folgende Felder durchgeführt:- Persönliche Daten, vor allem in der Verarbeitung von Namen und Adresse
- Berufserfahrung, die die Dauer anstatt einer Periode angeben (zum Beispiel: 1 Jahr oder 2 Monate)
- Sprachkenntnisse
- Englisch und Französisch: Verbesserung durch die Deep Learning Technik
Durch die Implementation von Deep Learning im 2014.1 Release konnte eine erhebliche Verbesserung im englischem und französischem Model für alle Felder realisiert werden.
- Deutsch: Verbesserungen für
- Seiten – Identifikation (Aufspüren von CV-Seiten in eingescannten PDF- Dateien)
- das Parsen von chronologischen Lebensläufen (CVs die Ausbildungen und Berufserfahrungen gemischt in einer langen Anordnung zusammenfassen)
- die Extraktion des Jobtitels
- Italienisch: Verbesserung in der Verarbeitung von persönlichen Details
Wollen Sie mehr über unsere CV Parsing Software wissen oder diese selbst testen?
Nehmen Sie Kontakt mit und auf oder bestellen Sie eine Demoversion.