導(dǎo)讀:人臉識別技術(shù)日趨成熟,商業(yè)化應(yīng)用愈加廣泛。為防止惡意者偽造或竊取他人的人臉特征用于身份認(rèn)證,人臉識別系統(tǒng)需具備活體檢測功能,以判斷提交的人臉特征是否來自有生命的真實(shí)個體。
圖片來自“123rf.com.cn”
人臉識別技術(shù)日趨成熟,商業(yè)化應(yīng)用愈加廣泛。然而,人臉卻極易通過照片、視頻,甚至仿真模具等方式進(jìn)行復(fù)制,通過提前準(zhǔn)備這些“道具”,惡意者試圖在識別過程中進(jìn)行偽裝,以圖通過驗證,達(dá)到非法入侵的目的。為防止惡意者偽造或竊取他人的人臉特征用于身份認(rèn)證,人臉識別系統(tǒng)需具備活體檢測功能,以判斷提交的人臉特征是否來自有生命的真實(shí)個體。
人臉門禁的基本功能是人臉驗證(Face Verification),而活體檢測屬于人臉防偽技術(shù)(Face Anti-Spoofing)。人臉驗證和人臉防偽,兩種技術(shù)各有側(cè)重。
人臉驗證:人臉驗證是判斷兩個人臉圖是否為同一個人的算法,即通過人臉比對獲得兩個人臉特征的相似度,然后與預(yù)設(shè)的閾值比較,相似度大于閾值,則為同一人,反之則不同。這是近年來一個非常熱門的研究方向,也產(chǎn)生了一大批算法模型和損失函數(shù)。
人臉防偽:用戶刷臉的時候,算法要甄別這張臉是不是真人活體臉,而對于照片、視頻和假體面具等攻擊行為,算法應(yīng)該予以拒絕。
1、照片攻擊與活體檢測
照片是最簡單的攻擊方式,利用社交媒體,例如微信朋友圈或微博,可以輕而易舉地獲得相關(guān)人員的照片。但照片畢竟是靜態(tài)的,不能做出眨眼、張嘴、轉(zhuǎn)頭等動作。利用這個特點(diǎn),活體檢測系統(tǒng)可以下達(dá)幾個動作指令,通過對被檢測人員的動作符合性判斷,就可以實(shí)現(xiàn)交互式的動作活體檢測。
為了對付動作活體檢測,有攻擊者改進(jìn)照片偽裝,按真人尺寸打印另外一個人的照片,在照片的眼睛和嘴巴部位鏤空,貼在臉上,露出眼睛和嘴巴。按照活體檢測系統(tǒng)的指令,執(zhí)行眨眼、張嘴、轉(zhuǎn)頭等動作。但是,這種偽造的效果與真實(shí)人臉實(shí)際的運(yùn)動情況相去甚遠(yuǎn),很容易被檢測算法識別。
2、視頻攻擊與活體檢測
視頻攻擊則是將另一人的動作錄成視頻,對著檢測系統(tǒng)播放。但是,播放器的屏幕通過攝像頭成像,其人臉的畫面與真人也存在較大差別,最明顯的就是存在摩爾紋、反光、倒影、畫質(zhì)模糊、失真等特點(diǎn),十分容易甄別。更何況,播放的視頻與動作指令也存在不合拍的問題。
3、假體攻擊與活體檢測
假體攻擊就是做一個與真人相似的立體面具,這種方式解決了照片和視頻播放的平面性缺陷。假體有很多種,最普通的是塑料或者硬紙做成的面具,成本低廉,但材質(zhì)相似度極低,用普通紋理特征就可以識別出來。高級一點(diǎn)的有硅膠、乳膠以及3D打印的的立體面具,這類面具的表觀與皮膚接近,但材料的表面反射率和真實(shí)人臉還是存在差異,因此在成像上仍然有差別。
動作活體檢測的方式具有很高的安全性,但要求用戶配合做指定動作,因此實(shí)際用戶體驗較差。為了實(shí)現(xiàn)無感通行的效果,人臉門禁很少采用響應(yīng)指令的動作活體檢測,通?;趫D像和光學(xué)效果的差別實(shí)施活體甄別。
1、普通攝像頭活體檢測
雖然沒有配合指令的動作響應(yīng),但真實(shí)的人臉也不是絕對靜止的,總有一些微表情的存在,比如眼皮和眼球的律動、眨眼、嘴唇及其周邊面頰的伸縮等。同時,真實(shí)人臉與紙片、屏幕、立體面具等攻擊媒介的反射特性不同,所以成像也不同。宇視配合基于摩爾紋、反光、倒影、紋理等特征的檢測,檢測系統(tǒng)可以輕松的對付照片、視頻、假體的攻擊。
利用特定的某種物理特征,或多種物理特征的融合,我們可以通過深度學(xué)習(xí)訓(xùn)練神經(jīng)網(wǎng)絡(luò)分類器,以區(qū)分是活體,還是攻擊?;铙w檢測中的物理特征主要分為紋理特征、顏色特征、頻譜特征、運(yùn)動特征、圖像質(zhì)量特征,此外,還包括心跳特征等。
紋理特征包括很多,但最主流的是LBP、HOG、LPQ等。
顏色特征除了RGB之外,學(xué)術(shù)界發(fā)現(xiàn)HSV或YCbCr具有更好的區(qū)分活體非活體的性能,被廣泛用于不同的紋理特征上。
頻譜特征的原理是活體、非活體在某些頻段具有不同的響應(yīng)。
運(yùn)動特征提取目標(biāo)在不同時間上的變化,是一個有效的辦法,但通常耗時較久,達(dá)不到實(shí)時的要求。
圖像質(zhì)量特征有很多描述方式,比如反射、散射、邊緣或形狀等。
2、紅外攝像頭活體檢測
紅外人臉活體檢測主要是基于光流法而實(shí)現(xiàn)。光流法是利用圖像序列中的像素強(qiáng)度數(shù)據(jù)的時域變化和相關(guān)性來確定各像素位置的“運(yùn)動”,即從圖像序列中得到各個像素點(diǎn)的運(yùn)行信息,采用高斯差分濾波器、LBP特征和支持向量機(jī)進(jìn)行數(shù)據(jù)統(tǒng)計分析。
同時,光流場對物體運(yùn)動比較敏感,利用光流場可以統(tǒng)一檢測眼球移動和眨眼。這種活體檢測方式可以在用戶無配合的情況下實(shí)現(xiàn)盲測。
從上述兩張圖的對比可以看出,活體人臉的光流特征顯示為不規(guī)則的向量特征,而照片人臉的光流特征則是規(guī)則有序的向量特征,以此即可區(qū)分活體和照片。
3、3D攝像頭活體檢測
通過3D攝像頭拍攝人臉,獲取相應(yīng)的人臉區(qū)域的3D數(shù)據(jù),基于這些數(shù)據(jù),選擇最具有區(qū)分度的特征來訓(xùn)練神經(jīng)網(wǎng)絡(luò)分類器,最終利用訓(xùn)練好的分類器區(qū)分活體和非活體。特征的選擇至關(guān)重要,我們選擇的特征既包含了全局的信息,也包含了局部的信息,這樣的選擇有利于算法的穩(wěn)定性和魯棒性。
3D人臉活體檢測分為以下3個步驟:
首先,提取活體和非活體人臉區(qū)域的N個(推薦256個)特征點(diǎn)的三維信息,對這些點(diǎn)之間的幾何結(jié)構(gòu)關(guān)系進(jìn)行初步的分析處理;
其次,提取整個人臉區(qū)域的三維信息,對相應(yīng)的特征點(diǎn)做進(jìn)一步的處理,再采用協(xié)調(diào)訓(xùn)練Co-training的方法訓(xùn)練正負(fù)樣本數(shù)據(jù),利用得到的分類器進(jìn)行初分類;
最后,利用以上兩個步驟所提取的特征點(diǎn)進(jìn)行曲面的擬合來描述三維模型特征,根據(jù)曲面的曲率從深度圖像中提取凸起區(qū)域,對每個區(qū)域提取EGI特征,然后利用其球形相關(guān)度進(jìn)行再分類識別。
活體檢測是人臉門禁系統(tǒng)的必備技術(shù),準(zhǔn)確率可達(dá)99%以上,廣受客戶好評。在身份認(rèn)證和無感通行日益普及的今天,活體檢測為大眾的工作和生活提供更多的安全保障