對(duì)于資訊類(lèi)產(chǎn)品和內(nèi)容內(nèi)產(chǎn)品來(lái)說(shuō),內(nèi)容審核是必不可少的環(huán)節(jié)之一。用戶發(fā)布的內(nèi)容不受平臺(tái)控制,而部分內(nèi)容會(huì)給平臺(tái)造成風(fēng)險(xiǎn),審核是阻斷內(nèi)容風(fēng)險(xiǎn)的主要方式。
“目前市面上的內(nèi)容平臺(tái)主要是采用機(jī)審與人工審核相結(jié)合的方式,很少有只有單一審核的方式?!?數(shù)美科技高級(jí)產(chǎn)品經(jīng)理曉陽(yáng)告訴記者。
曉陽(yáng)說(shuō),最早出現(xiàn)的審核模式就是人工審核,但人工審核有三個(gè)明顯的缺點(diǎn):監(jiān)管理解有難度、成本高、時(shí)效性差。
“大量腰部的中小型企業(yè)往往團(tuán)隊(duì)規(guī)模比較小,成立年限比較短而且集中投入在產(chǎn)品上,沒(méi)有精力投入到合規(guī)研究中。所以在輿情關(guān)注以及對(duì)新規(guī)的理解層面,光靠一個(gè)經(jīng)驗(yàn)豐富的人來(lái)審核是不行的,需要組建一支類(lèi)似這樣的人工審核團(tuán)隊(duì),但是這種操作難度較大,一般只有大廠才會(huì)有這個(gè)能力與資源儲(chǔ)備。其次,人工審核在處理音視頻的時(shí)候內(nèi)容有多長(zhǎng),審核就要多久,甚至更久。這就會(huì)產(chǎn)生更多的衍生問(wèn)題,比如固定的單人審核能效必將導(dǎo)致更加龐大的審核團(tuán)隊(duì),又或是等待審核時(shí)長(zhǎng)過(guò)長(zhǎng)導(dǎo)致的用戶流失。因此這既是效率問(wèn)題,也是用戶體驗(yàn)問(wèn)題,但最終都會(huì)回到成本問(wèn)題。”曉陽(yáng)說(shuō)。
2019年1月9日,中國(guó)網(wǎng)絡(luò)視聽(tīng)節(jié)目服務(wù)協(xié)會(huì)發(fā)布了《網(wǎng)絡(luò)短視頻平臺(tái)管理規(guī)范》和《網(wǎng)絡(luò)短視頻內(nèi)容審核標(biāo)準(zhǔn)細(xì)則》。其中規(guī)定,短視頻平臺(tái)發(fā)布的節(jié)目、評(píng)論、彈幕等內(nèi)容,必須先審后發(fā);并且詳細(xì)列出了二十大類(lèi),100小條的禁止內(nèi)容。2022年3月2日,國(guó)家網(wǎng)信辦就《互聯(lián)網(wǎng)彈窗信息推送服務(wù)管理規(guī)定(征求意見(jiàn)稿)》公開(kāi)征求意見(jiàn)。其中擬規(guī)定,配備與服務(wù)規(guī)模相適應(yīng)的人工力量,健全彈窗信息推送內(nèi)容管理規(guī)范,完善信息篩選、編輯、推送等工作流程,確保彈窗信息推送必須經(jīng)過(guò)人工審核。
審核新規(guī)落地,也就意味著互聯(lián)網(wǎng)平臺(tái)審核需要更細(xì)、范圍更廣,擴(kuò)充審核隊(duì)伍成了各大互聯(lián)網(wǎng)公司的迫切需求。
資料顯示,2020年B站內(nèi)容篩選團(tuán)隊(duì)約有2400名員工;小紅書(shū)審核員工有1000多人;字節(jié)跳動(dòng)的內(nèi)容審核員更是超過(guò)2萬(wàn)人。
根據(jù)某UGC(用戶原創(chuàng)內(nèi)容)平臺(tái)曾對(duì)外公布的武漢審核員的公開(kāi)招聘信息顯示,審核專(zhuān)員月薪在4000—6000元。按照8%公積金繳納比例測(cè)算,用工成本在5344元—8016元之間。
粗略計(jì)算,該平臺(tái)內(nèi)容審核團(tuán)隊(duì)一年的用工成本或在1.53億元—2.31億元之間。
不過(guò),曉陽(yáng)進(jìn)一步告訴記者,就算監(jiān)管與成本方面可以通過(guò)投入大量的人力以及預(yù)算來(lái)解決,但時(shí)效性差的問(wèn)題是無(wú)法用金錢(qián)來(lái)解決的。
他以應(yīng)對(duì)輿情的能力為例,當(dāng)平臺(tái)發(fā)現(xiàn)某種嚴(yán)格管控的風(fēng)險(xiǎn)內(nèi)容,不僅要處理當(dāng)下的新發(fā)信息,也要同時(shí)檢查所有的數(shù)千萬(wàn)甚至數(shù)億條歷史存量信息。想要短時(shí)間內(nèi)完成歷史存量的篩查,這是人工審核絕不可能完成的。
所以,在風(fēng)險(xiǎn)和用戶體驗(yàn)雙重重壓之下,僅依賴(lài)人工審核是不現(xiàn)實(shí)的,使用機(jī)器輔助人工審核才是最優(yōu)的選擇。
那么,在人工智能飛速發(fā)展的當(dāng)下,為什么還需要這么多內(nèi)容審核員?用AI技術(shù)難道不行嗎?
對(duì)此,曉陽(yáng)表示,實(shí)際上現(xiàn)階段機(jī)審還有幾個(gè)無(wú)法逾越的鴻溝,比如目前的模型沒(méi)有辦法取代人,它不具備人的深度思考能力、聯(lián)想能力、聯(lián)系上下文能力等等。再比如機(jī)器在某些審核標(biāo)準(zhǔn)上很難把控,因?yàn)闄C(jī)器不具備主觀性,像是無(wú)法理解軟色情/色情/曖昧色情的定義和區(qū)別,這就需要人的介入。
“就目前而言,AI技術(shù)并不能完全替代人工審核,平臺(tái)還是需要借助人的經(jīng)驗(yàn)和判斷來(lái)篩選內(nèi)容?!睍躁?yáng)說(shuō),AI只能起到輔助作用,其重點(diǎn)主要是進(jìn)行初篩,對(duì)明顯違規(guī)的問(wèn)題內(nèi)容第一時(shí)間進(jìn)行“刪除”,同時(shí)通過(guò)數(shù)據(jù)比對(duì)、對(duì)侵權(quán)的內(nèi)容(圖文、視頻特別是被剪短的影視?。┻M(jìn)行有效遏制。大量?jī)?nèi)容中的隱藏問(wèn)題,常人尚且未必能秒懂,何況人工智能。
一些平臺(tái)的內(nèi)容創(chuàng)作者,手法、技巧都更上一層樓,比如將中心思想隱喻在歷史故事、將敏感信息加密等,機(jī)器很難識(shí)別到,二是這些平臺(tái)的影響范圍廣,稍有不慎就會(huì)讓輿論偏向,所以大平臺(tái)的內(nèi)容安全審核工作都需要人的協(xié)作。
《哈佛商業(yè)評(píng)論》做過(guò)一項(xiàng)涉及1500家企業(yè)的研究,結(jié)果顯示,當(dāng)人類(lèi)和機(jī)器一起工作時(shí),企業(yè)受益最大,調(diào)查同時(shí)指出,人類(lèi)有某些特征,機(jī)器無(wú)法承擔(dān),反之亦然。一個(gè)簡(jiǎn)單的例子是,一個(gè)人開(kāi)玩笑諷刺某個(gè)人,我們輕易就能搞懂,但機(jī)器很難理解,而分析海量的數(shù)據(jù)對(duì)機(jī)器來(lái)說(shuō)很容易,對(duì)人類(lèi)來(lái)說(shuō)幾乎是不可能。
“人工智能主要依賴(lài)的算法是深度學(xué)習(xí)的方法,只能從數(shù)據(jù)來(lái)學(xué)習(xí),而人類(lèi)除了歸納學(xué)習(xí)之外,還可以演繹推理,機(jī)器并不具備該能力。因此在很多情況下內(nèi)容審核必須要依靠人工來(lái)完成審核?!睍躁?yáng)說(shuō)。
值得一提的是,目前一些低端、重復(fù)的審核工作或許很快會(huì)被AI技術(shù)所取代。2019年7月,今日頭條宣布正式推出新版“靈犬”反低俗助手;2020年9月,小紅書(shū)在“啄木鳥(niǎo)”計(jì)劃中,就加入了“多維度算法模型”的審核模式;快手也早將AI技術(shù)運(yùn)用進(jìn)了內(nèi)容審核中;阿里巴巴則是基于視覺(jué)分析技術(shù)和深度識(shí)別技術(shù)從而大幅度降低人工審核成本;2021年9月,數(shù)美科技推出了三級(jí)風(fēng)險(xiǎn)內(nèi)容標(biāo)簽體系,下設(shè)1000多個(gè)細(xì)化標(biāo)簽并建立糾錯(cuò)機(jī)制。
“各大廠商在機(jī)審層面引入AI技術(shù)也是為了盡可能精準(zhǔn)識(shí)別風(fēng)險(xiǎn),而人機(jī)結(jié)合的交接部分——人工審核平臺(tái)的設(shè)計(jì)也是非常重要的課題,它兼具重大的商業(yè)意義和社會(huì)意義?!睍躁?yáng)說(shuō)。“現(xiàn)在的人工智能審核技術(shù),仍然處于一個(gè)高速發(fā)展的時(shí)期。如果說(shuō)AI機(jī)審?fù)耆軌虼嫒斯徍?,我認(rèn)為在現(xiàn)在這個(gè)階段很難做到,但是用人工智能技術(shù)解放人力,還有著十分廣闊的想象空間,值得數(shù)美乃至全球AI企業(yè)為之不懈努力?!?/p>
關(guān)鍵詞: