本文作者:詐胡

性感與色情有多遠——你不知道的圖片鑒黃那些事兒

詐胡 1年前 ( 2018-10-28 ) 3538 4條評論

圖片鑒黃服務市場容量巨大,作為移動互聯網行業最為熱門的創業領域,移動社交類App每天生產大量圖片,并有無數色情圖片混雜其中,所以高效準確地鑒別和剔除淫穢色情信息成為一項十分艱巨的任務。

此外,移動直播的大熱也導致圖片鑒黃需求大增,尤其對于中小開發團隊而言,直播平臺很可能因為人力監管問題而在涉黃審核方面出現風險。而自主研發鑒黃功能或增加審核人員又會增加產品和服務外的支出,給前期開發造成額外壓力。利用人工智能圖像識別技術進行高效準確的自動化鑒黃服務,能降低企業使用鑒黃服務的技術門檻,幫助企業有效減少相關人力成本的投入。

如何界定性感與色情

性感與色情有多遠——你不知道的圖片鑒黃那些事兒 科技資訊 第1張


△ 傳統神經網絡與深度神經網絡

機器學習是人工智能的核心,簡單來講它就是:運用一套通用的算法——泛型算法,建立起數據邏輯,利用模仿人腦的機制來解釋數據,讓機器自動學習良好的特征,從而減少人工審核的過程。

舉例來說,想要教會機器去識別色情圖像,需利用成千上萬的圖片樣本去“訓練”它,提取色情圖片特征并不斷記憶。每張圖片中的任何一個點都包括亮度值、色相值、飽和度值,通過設置這三個值的大小范圍,機器能識別出“肉色”,進而猜測出圖片里裸露的人體皮膚區域。

色情圖片最明顯的特點就是畫面中人體皮膚顏色所占比例較大,當機器識別圖片中有類似人體膚色區域后,需要進一步確認區域的來源,看他們是沒有穿衣服的女主角還是正常物體。假設兩塊黃色區域分別是兩條腿或者兩只胳膊,另一塊區域是人的身體,這些區域的長度值、寬度值符合人體大小比例,且彼此位置滿足一定的幾何關系,則有很大可能是色情圖片,如果這些區域之間大小和位置不像是人的身體,則可以排除色情圖片的嫌疑。

性感與色情有多遠——你不知道的圖片鑒黃那些事兒 科技資訊 第2張

△ 計算膚色區域的幾何關系

性感與色情有多遠——你不知道的圖片鑒黃那些事兒 科技資訊 第3張

△ 圖片區分標準

  • 色情:裸露敏感部位,包含露骨鏡頭,描述性交行為和色情場景的圖片。

  • 性感:衣著暴露但沒有裸露敏感部位。

  • 正常:非色情,非性感圖片。

色情與藝術的鑒定標準是人定的,理論上講可以通過刻意訓練、調整閾值等手段讓機器更符合自己的標準,色情圖片數量越多,風格和場景越多樣化,機器學習結果越準確。

機器學習的一個主要優勢在于可以利用大數據樣本,在學習的過程中不斷提高識別精度。得益于今年來計算機速度的提升、大規模集群技術的興起、GPU 的應用以及眾多優化算法的出現,耗時數月的訓練過程可縮短為數天甚至數小時,機器學習可以被廣泛運用,大大提升鑒黃效率。

人工智能圖片鑒黃:機器學習與人工審核相結合

性感與色情有多遠——你不知道的圖片鑒黃那些事兒 科技資訊 第4張

△ 又拍云智能鑒黃工作流程

又拍云“智能鑒黃”功能將自動對直播、視頻、圖片等內容進行鑒別。目前在一張圖片鑒黃的完整過程是將它拿到鑒黃中心鑒別,完畢后,再把結果發送至圖片審核平臺進行最終確認。對于疑是色情圖片將由人工審核確認,而這部分將會隨著訓練次數的增加而不斷減少,幫助運營團隊節省人工審核成本。

如何進行直播鑒黃

通常情況下,視頻直播鑒黃服務利用視頻截圖、圖像識別、語音審核、彈幕監控、關鍵詞提取等方式識別色情內容。

其中視頻直播的鑒黃可按照以下步驟:識別圖像中是否存在人物體征并統計人數;識別圖像中人物的性別、年齡區間;識別人物的膚色、肢體器官暴露程度;識別人物的肢體輪廓,分析動作行為;提取音頻信息關鍵詞,判斷是否存在敏感信息;實時分析彈幕文本內容,判斷當前視頻是否存在違規行為。每分鐘視頻采集關鍵幀的頻率可由客戶自主設定,從1秒到幾十秒均可,例如可以默認5秒采集一次關鍵幀用于識別。



文章版權及轉載聲明:

作者:詐胡本文地址:http://www.mcsaim.live/post/1169.html發布于 1年前 ( 2018-10-28 )
文章轉載或復制請以超鏈接形式并注明出處每日一學網

分享到:

覺得文章有用就打賞一下文章作者

支付寶掃一掃打賞

微信掃一掃打賞

發表評論

快捷回復:

評論列表 (有 4 條評論,3538人圍觀)參與討論
網友昵稱:訪客
訪客 游客2018-12-03涼席 回復
長知識
網友昵稱:訪客
訪客 游客2018-10-30板凳 回復
給小編加雞腿,原來機器是這樣鑒別色情圖片的[confuse]漲知識了[kiss]
網友昵稱:訪客
訪客 游客2018-10-28椅子 回復
漲知識了
網友昵稱:每日一學網站長
每日一學網站長 管理員2018-10-28沙發 回復
可啪可啪