הטכנולוגיה

בפיתוח CVSCIENCE לניתוח קורות חיים אוטומטי עשינו שימוש בטכנולוגיות רבות אשר מטרתן להשיג דיוק, עומק, ומהירות תוך ניסיון לחקות
את צורת הקריאה של קורא אנושי. לשם אימון המערכת השתמשנו במאגר של יותר מ 25,000 קורות חיים ואנחנו ממשיכים לשפר ולעדכן את
האלגוריתמים:

Native Document Analysis

טכנולוגיות קריאת מסמכים מהירה ביותר - אשר מאפשרת טיפול מהיר, על כל
פלטפורמה (לינוקס, ווינדוס). קריאת NATIVE של מסמכים מאפשרת טיפול מהיר
ביותר של מסמכים תוך ניצול טוב יותר של משאבי מחשוב.

Dictionary-Based analysis

המערכת משתמשת במילונים שונים אשר נועדו לאתר בצורה מדויקת נושאים שונים
בתוך המסמכים


Cross-Format Inspection

פיתחנו טכנולוגיית Object-Oriented אשר מאפשרת לקרוא לעומק נתונים מתוך
הפורמטים הנפוצים בישראל: Microsoft Office, Open-Office, Apple IWork's
.Office, PDF ,RTF, TXT, HTML

Probabilistic-Analysis

עשינו שימוש רב באלגוריתמים סטטיסטיים אשר מנסים לחקות את דרך הקריאה
האנושית, כדי להבין תכנים בעלי פירושים רבים, וזאת על פי טבלאות שכיחות
סטטיסטית


Open WEB API

המערכת מתוכננת לספק שירות ניתוח קורות חיים באמצעות ממשק רשת פתוח, תוך
שימוש בפורמטים פתוחים: XML, SOAP, JSON, REST ועוד.

מה זה ניתוח-קורות-חיים-אוטומטי?

בכל העולם, קבצי WORD , הם עדיין הפורמט השכיח ביותר לקורות חיים. קל לנו, בני האדם, לקרוא את המסמכים הללו, עם זאת, למחשב הם פשוט רצף של אותיות, מספרים וסימני פיסוק. תוכנת ניתוח-קורות-חיים היא תוכנת מחשב שמסוגלת לנתח את הרצף הזה ולחלץ ממנה את האלמנטים החשובים לקורא.

חילוץ נתונים מתוך קורות חיים היא משימה קשה באופן מפתיע למחשב. חלק מהסיבה לכך הוא השפה שהשתנתה וממשיכה להתפתח. ישנם עשרות דרכים לכתוב את תאריך, למשל, ואין ספור דרכים לכתוב את הניסיון התעסוקתי.
בעיה נוספת עוד יותר היא עמימות/דו-משמעיות, שבה המילה או צירוף המילים יכולה להיות דברים שונים בהקשרים שונים. לדוגמא, "מנהל" יכול להיות עבודת כותרת בהקשרים מסוימים, או חבילת תוכנה באחרים. מספר בן 4 ספרות יכול להיות חלק ממספר טלפון, חלק ממיקוד, שנה, גרסה של חבילת תוכנה, או הרבה דברים אחרים בהתאם למילים המקיפות אותו. המונח "מנהל פרויקט" בקורות חיים עשוי להצביע על כך שהכותב אכן היה מנהל פרויקט, אך לא בהקשר "אני מדווח למנהל הפרויקט". דוגמא נוספת – קורות חיים בהם רשום שהכתובת היא "שדרות ירושלים יפו" – האם היישוב הוא שדרות? ירושלים? יפו? מערכת קריאת קורות חיים טובה, צריכה 'להבין' שמדובר ברחוב "שדרות ירושלים" אשר בעיר תל-אביב-יפו.



נשמע מעניין? צור קשר להפעלת השירות