首先要拉平一個認知:看簡歷是個體力活,如同高考文科閱卷,看多了是真的會瞎的。
不知道什么時候開始,資本市場盯上了求職招聘渠道,于是,HR吃“筍”的季節(jié)就到了,一頓兩頓鮮美可口,日子久了,企業(yè)每個在招職位都可能有成百上千的投遞量,造成HR要篩選、評估大量簡歷?!肮S”吃膩了就會派生出HR各種各樣的“神”操作,三秒看一份簡歷、成批量Pass簡歷、邀約面試“臉盲”現(xiàn)象比比皆是,一定程度上影響了后期的人才精準化對位。
這些只是表象,內(nèi)核其實是HR每天為積累更加豐富的企業(yè)人才庫,將來自各渠道五花八門的簡歷進行關(guān)鍵信息檢索再匹配到崗位,真的會篩到“痛哭”。行業(yè)數(shù)據(jù)也驗證了這一項工作的疼痛指數(shù):在HR的有效工作時間內(nèi),簡歷篩選的時間占比超過50%!
不過伴隨著AI技術(shù)的發(fā)展,識別簡歷中固定字段的簡歷解析技術(shù)也正在逐步趨向于成熟。
至于簡歷解析是什么?
總體來說,是對非結(jié)構(gòu)化的簡歷文本實現(xiàn)準確、高效的關(guān)鍵信息抽取,自動識別簡歷中個人的基本信息、工作經(jīng)驗、教育經(jīng)歷等方方面面的內(nèi)容,實現(xiàn)簡歷的結(jié)構(gòu)化處理,降低人力整理的成本,簡化HR錄入簡歷過程??偠灾?,就是要在招聘開始就規(guī)范求職者畫像,讓HR拿到簡歷想看到什么就第一眼能看到,最終為招聘管理系統(tǒng)實現(xiàn)人崗自動化匹配、數(shù)據(jù)精準化提取、渠道簡歷篩選、查重提供堅實基礎(chǔ)。
Moka招聘管理系統(tǒng)利用大數(shù)據(jù)與AI 技術(shù),提升了簡歷解析的數(shù)據(jù)覆蓋范圍與精準度,實現(xiàn)了優(yōu)于同行業(yè)解析水平10%的提升。
目前Moka招聘管理系統(tǒng)的簡歷解析技術(shù)結(jié)合了概率圖模型、傳統(tǒng)機器學習模型與深度學習模型,包括當前業(yè)界效果最優(yōu)的LSTM(長短期記憶網(wǎng)絡(luò))+CRF(條件隨機場)模型、OCR(圖像文字提?。┑燃夹g(shù),解析維度超過100個,新技術(shù)的使用讓 Moka在國內(nèi)招聘管理系統(tǒng)走向AI智能化的競速賽中,實現(xiàn)了彎道超車。
在業(yè)內(nèi),簡歷解析的技術(shù)壁壘一直以來沒有明確的“三八線”,只要對程序有一些了解就可以做到,但是要做到準確率不斷優(yōu)化,在實踐中無止境的和HR工作場景吻合是非常難的,那么Moka招聘管理系統(tǒng)是如何實現(xiàn)這10%準確率提升的呢?
自定義模型抓取,讓簡歷解析一開始就是精準的
Moka招聘管理系統(tǒng)針對不同簡歷的格式采取了個性匹配化的信息抓取模型。
目前,同行業(yè)產(chǎn)品的簡歷抓取技術(shù)模型可針對PDF、Word等格式簡歷文本統(tǒng)一轉(zhuǎn)化為txt格式,但是這種“一刀切”的解析路徑會嚴重影響到不同格式簡歷解析的準確率,例如,我們看大多數(shù)的簡歷解析路徑都是從上至下來讀取簡歷文本信息的,所以一旦一份簡歷的撰寫格式是從左到右的,那解析就會出現(xiàn)錯亂。
為此,Moka招聘管理系統(tǒng)針對html、pdf、doc、docx、ppt、pptx、eml、txt等格式的簡歷解析做了專門的解析模型,而對于圖片類簡歷,采用更垂直領(lǐng)域的訓(xùn)練數(shù)據(jù)訓(xùn)練OCR (圖像文字提取技術(shù))的模型,使系統(tǒng)能更好地理解真實場景下的簡歷。
模塊解析,梳理簡歷信息鏈條
僅僅依靠針對不同簡歷的格式采取個性匹配化的信息抓取模型是遠遠不夠的。例如,很多公司并沒有標準化的名稱后綴,如華為科技、百度云網(wǎng)盤等。而且,假使在騰訊科技做商務(wù)對接的工作期間就涉及到了京東作為客戶的情況,那么要如何能讓人工智能讀懂這一段工作經(jīng)歷是在騰訊,而不會將關(guān)鍵信息聚焦在京東,怎么進行關(guān)鍵信息的解析呢?
在拿到針對不同簡歷的格式進行個性匹配化的信息抓取后,Moka智能化招聘管理系統(tǒng)對簡歷每個模塊進行了解析,如上下文特征,這一段落主旨在表達什么,上一個段落信息是否已經(jīng)齊全,是否能能聯(lián)系上下文進行模塊化的精準解析梳理,讓簡歷主旨鮮明,為AI對簡歷語意的加深理解掃清了障礙。
語句解析,加深候選人真實意思認知
當簡歷解析技術(shù)面對簡歷段落信息時,假如其中出現(xiàn)了多個標簽字段或者是沒有識別出任何字段時,這種情況帶來了新的考驗。如何提取句子的主旨信息就成為了關(guān)鍵,比如,如何判定語句內(nèi)容是公司名稱?項目名稱?或僅僅是一句可有可無的描述?這些在人的大腦中都要進行一定的判別,而在AI的世界中,人究竟要怎么訓(xùn)練它完成理解呢?
Moka招聘管理系統(tǒng)為提升解析的精準度,匹配以具體語句為單位的簡歷解析描述,將候選人簡歷在模塊區(qū)分的基礎(chǔ)上逐句進行語意解析,對關(guān)鍵字段難以識別的句子,充分考慮句內(nèi)以及句間關(guān)系,并聯(lián)系上下文建模,精準觸達候選人表達的意思,使解析趨向于提煉簡歷核心意思表示,讓HR閱讀簡歷工作事半功倍。
逐字解析,構(gòu)建候選人3D畫像
術(shù)業(yè)有專攻,在AI智能化的應(yīng)用中,招聘管理系統(tǒng)絕對算不上普惠的深水區(qū)。前有淘寶對于網(wǎng)絡(luò)用戶購買行為的解析、后有抖音對于用戶興趣偏好的解析,均是首屈一指,但在簡歷解析技術(shù)的試驗田內(nèi),Moka招聘管理系統(tǒng)確實獨具話語權(quán)。
例如:在針對簡歷中個別詞的解析時,“前端”可能在其他產(chǎn)品中解析出的結(jié)果僅僅是“前面”,可在Moka招聘管理系統(tǒng)中,會直接關(guān)聯(lián)到職位信息中。這就得益于Moka招聘管理系統(tǒng)對于逐個字段的解析能力,會自動聯(lián)系上下文全面解析該語意的真正意思,并通過前期積累的大量訓(xùn)練語料及貼合使用場景的詞向量的應(yīng)用,可精準化的根據(jù)簡歷信息構(gòu)建候選人3D畫像。
在Moka招聘管理系統(tǒng)的視角,簡歷解析準確率的提升遠遠不是終極目標,而未來招聘管理系統(tǒng)會走向什么樣的終點,似乎也沒有疆界。但確定無疑的是,未來AI技術(shù)在招聘領(lǐng)域的應(yīng)用絕對不局限于簡歷解析,還會滲透到HR工作中的方方面面,Moka會一直努力。