Posted on December 14, 2016

Neues Extract! Release mit Griechischem Parsing

Textkernel freut sich das neueste Extract! CV Parsing Release vorstellen zu dürfen. Dieses Release enthält eine brandneue CV Parsing Sprache – Griechisch – sowie viele Verbesserungen für alle Sprachen und spezifische Verbesserungen für Englisch, Flämisch, Slowakisch und Französisch.

Neu: Griechisches CV Parsing 

Aufgrund zahlreicher Kundenanfragen stellt Textkernel nun die 17. CV Parsing Sprache vor: Griechisch. Um eine neue CV Parsing Sprache hinzuzufügen muss Textkernels Parsing Engine trainiert werden und auf CVs in dieser Sprache angepasst werden. Textkernels Research Engineers gelang es die Vielfalt und Komplexität der Griechisches Sprache zu überwinden und konnten somit ein State-of-the-Art Sprachmodell entwickeln. Für detaillierte Informationen zur Entwicklung der neuen CV Parsing Sprache, lesen Sie unseren Blog Post – Greek CV parsing, an Odyssey

education

CV Parsing Verbesserungen 

Textkernels R&D Team hat an einigen weiteren Verbesserungen für alle CV Parsing Sprachen gearbeitet.

Verbesserungen für alle Sprachen

  • Neu: Extraktion von Apple’s Page Format (.pages): Zusätzlich zu den Standard Dateitypen (.doc, .docx., .pdf, .html oder .text) kann Textkernel nun auch .pages parsen
  • Support für Microsoft Word und PDF Untertypen: Textkernel hat einige Verbesserungen im Pre-Prozessor realisiert, der den Original-CV in einen Text verwandelt und dies schlussendlich für das Parsen nutzt. Textkernel akzeptiert nun mehr Unterkategorien von Microsoft Office und PDF.
  • Verbesserte Extraktion von Telefonnummern
  • Verbesserte Extraktion von Daten
  • Verbesserte Extraktion von Kompetenzen

Verbesserungen für Englisch

  • Verbesserte Extraktion von Kandidatennamen, vor allem wenn er Name nur auf der Titelseite sichtbar ist
  • In Ausbildungs- und Berufserfahrungen: Bessere Segmentierung der einzelnen Felder, bessere Erkennung von englischen Data
  • US: Bessere Extraktion von Städten, Regionen und Ländern
  • US: Bessere Extraktion von Unternehmensnamen und Standorten

Weitere Verbesserungen

  • Bessere Extraktionen von Namen in belgischen (flämischen) CVs
  • Slowakisch: Bessere Klassifikation von Ausbildungsitems und Diplomen
  • Französisch: Bessere Zerteilung von Adressen

Weitere Informationen

Möchten Sie mehr über Textkernels CV Parser oder dem neuen Release erfahren? Kontaktieren Sie uns direkt!