Le Chinois est la 15ème version du logiciel d’extraction de CV Extract! Textkernel a réussi à développer un produit performant, ce qui a représenté un challenge considérable.
Différences entre le modèle chinois et les modèles de langues occidentales
La langue et le script chinois sont entièrement différentes des langues occidentales. Un texte chinois se caractérise par une série de signes sans espace. Certaines combinaisons de caractères forment une unité de sens et l’utilisation d’une certaine combinaison de signes dépend du contexte dans lequel elle intervient.
Un étape supplémentaire dans le processus de parsing
Pour pouvoir parser un CV Chinois, les mots et les phrases doivent tout d’abord être identifiés dans une série de caractères. Pour compliquer encore les choses, le Chinois simplifié possède 7000 caractères dont 2500 sont utilisés couramment.
Surmonter les obstacles
Textkernel utilise des techniques de segmentation poussées pour identifier avec beaucoup de précision des unités sémantiques. En les combinant à la technologie d »extraction d’information utilisée dans le parsing d’autres langues, Textkernel a pu développer un parser performant capable d’analyser et structurer automatiquement des CVs en chinois dans votre base de donnée.
Demandez un démonstration en ligne
Votre entreprise reçoit des candidatures en langue chinoise? Vous voulez un aperçu des capacités de notre parsing de CV chinois ? Contactez nous pour une démonstration.