- +1
抖音首度披露算法機(jī)制:利用神經(jīng)網(wǎng)絡(luò)預(yù)估用戶行為,不依賴打標(biāo)簽,“機(jī)器+人工”雙重審核

抖音 視覺中國 資料圖
當(dāng)算法已經(jīng)深刻融入日常生活中,平臺(tái)應(yīng)當(dāng)如何管理算法,才能避免其無序發(fā)展、走向失控?
4月16日,澎湃新聞?dòng)浾攉@悉,近期抖音在北京舉辦“安全與信任中心開放日”活動(dòng),首次對平臺(tái)算法原理、平臺(tái)治理體系以及社會(huì)關(guān)切的問題進(jìn)行較為詳細(xì)的披露。
抖音曾經(jīng)多次因?yàn)樗惴?,陷入輿論爭議。去年農(nóng)夫山泉董事長鐘睒睒曾經(jīng)喊話字節(jié)跳動(dòng)創(chuàng)始人張一鳴,請求頭條和抖音停止對一個(gè)中國公民的侵害,“今日頭條你是實(shí)際控制人,同樣你是盈利性企業(yè)。你是一個(gè)有足夠量掌控輿論的平臺(tái)企業(yè),因?yàn)檫@樣的背景,所以請你承擔(dān)企業(yè)文明的規(guī)則?!?/p>
面對此前吳柳芳案件等帶來的算法和流量質(zhì)疑,抖音副總裁李亮曾經(jīng)多次在公開平臺(tái)回應(yīng),但始終未正面披露其背后的算法機(jī)制。
在此次發(fā)布會(huì)上,抖音算法工程師劉暢介紹,抖音推薦算法作為人工智能機(jī)器學(xué)習(xí)技術(shù)的重要應(yīng)用場景,本質(zhì)上是一套高效的信息過濾系統(tǒng)。
在抖音的實(shí)際應(yīng)用中,平臺(tái)推薦系統(tǒng)采取“人工+機(jī)器”協(xié)同的方式進(jìn)行風(fēng)險(xiǎn)治理:由人工運(yùn)營和治理體系為算法導(dǎo)航;同時(shí)多目標(biāo)體系算法主動(dòng)打破 “信息繭房”,為用戶帶來更豐富的推薦結(jié)果。

從推薦算法來看,抖音與國內(nèi)外大部分內(nèi)容推薦平臺(tái)相似,包含召回、過濾、排序等環(huán)節(jié),重點(diǎn)是學(xué)習(xí)用戶行為。抖音基于用戶行為的推薦方法包含多種技術(shù)模型,如協(xié)同過濾、雙塔召回、Wide&Deep模型(均為推薦系統(tǒng)中常用模型)等。算法可以在完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶,把其他人感興趣的內(nèi)容推薦給該用戶。
目前,抖音算法已幾乎不依賴對內(nèi)容和用戶打標(biāo)簽,而是通過神經(jīng)網(wǎng)絡(luò)計(jì)算,預(yù)估用戶行為,計(jì)算用戶觀看這條內(nèi)容獲得的價(jià)值總和,把排名靠前的內(nèi)容推給用戶。
談到外界擔(dān)憂的“信息繭房”問題,劉暢介紹,抖音算法在多目標(biāo)建模體系下,設(shè)置專門的探索維度:一是對用戶在平臺(tái)上已經(jīng)表現(xiàn)出的興趣,盡可能推薦更多樣的內(nèi)容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次。
二是幫助用戶探索更多新興趣,采用隨機(jī)推薦、基于用戶社交關(guān)系拓展興趣、搜索推薦聯(lián)動(dòng)、“不感興趣”不再展現(xiàn)等多種方式,讓用戶的主動(dòng)行為影響推薦系統(tǒng),使推薦更加個(gè)性化和多樣化。
算法能學(xué)習(xí)、預(yù)估用戶行為,但因其無法理解內(nèi)容語義,對內(nèi)容的理解存在不足,可能導(dǎo)致違法違規(guī)、不良內(nèi)容被推薦傳播。因此,算法在真實(shí)使用場景中,必須由平臺(tái)治理對其進(jìn)行約束和規(guī)范。
在內(nèi)容治理方面,據(jù)抖音生態(tài)運(yùn)營經(jīng)理陳丹丹介紹,抖音的體系是“人工參與+機(jī)器學(xué)習(xí)”相結(jié)合的模式,并組建專門的平臺(tái)治理團(tuán)隊(duì)為算法設(shè)置“護(hù)欄”,具體治理體系包括異常感知、標(biāo)準(zhǔn)定義、機(jī)器識(shí)別、人工研判、風(fēng)險(xiǎn)處置等過程。
治理流程秉持兩大準(zhǔn)則:第一:所有在平臺(tái)發(fā)布的內(nèi)容都會(huì)經(jīng)過評(píng)估,流量越高的內(nèi)容評(píng)估次數(shù)越多,標(biāo)準(zhǔn)也越嚴(yán)格。
第二:抖音內(nèi)容審核采用“人工+機(jī)器”相互配合的模式,“機(jī)器”負(fù)責(zé)“寬度”評(píng)估所有投稿,“人工”負(fù)責(zé)“深度”,確保專業(yè)、敏感或疑難等問題盡可能精準(zhǔn)研判。
創(chuàng)作者將內(nèi)容上傳至抖音后,首先進(jìn)入機(jī)器識(shí)別環(huán)節(jié)。如果內(nèi)容被識(shí)別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問題,則會(huì)送至人工審核,若問題概率較低,則獲得基礎(chǔ)流量進(jìn)入下一環(huán)節(jié)。
視頻被舉報(bào)、評(píng)論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況出現(xiàn),均可能觸發(fā)“人工+機(jī)器”審核。一旦內(nèi)容在任一環(huán)節(jié)被處置,系統(tǒng)會(huì)立即停止進(jìn)一步推薦和分發(fā)。
針對社會(huì)普遍關(guān)心的、對用戶造成較多困擾的焦點(diǎn)問題,抖音成立數(shù)個(gè)專項(xiàng)治理團(tuán)隊(duì),針對詐騙、網(wǎng)暴、虛假擺拍、未成年人保護(hù)、網(wǎng)絡(luò)水軍、AIGC技術(shù)濫用等一系列重大專項(xiàng)風(fēng)險(xiǎn)進(jìn)行治理。例如,在不實(shí)信息治理方面,抖音于近日上線了辟謠卡,遏制不實(shí)信息的傳播。
此外,抖音安全與信任中心網(wǎng)站已經(jīng)處于試運(yùn)行階段,正廣泛向用戶、創(chuàng)作者、社會(huì)各界征集意見。
算法治理已成為當(dāng)今平臺(tái)面臨的共同問題。此前中央網(wǎng)信辦副主任、國家網(wǎng)信辦副主任牛一兵在“堅(jiān)持主流價(jià)值導(dǎo)向 推動(dòng)算法向上向善”主題分享會(huì)上致辭時(shí)強(qiáng)調(diào),中央網(wǎng)信辦聚焦黨中央關(guān)心、人民群眾關(guān)切的算法問題,以壓實(shí)網(wǎng)站平臺(tái)主體責(zé)任為抓手,出臺(tái)系列政策法規(guī),構(gòu)建算法備案、安全評(píng)估、監(jiān)測檢查、執(zhí)法處罰等全流程監(jiān)管體系,算法應(yīng)用生態(tài)持續(xù)向好。
加強(qiáng)算法治理,是維護(hù)網(wǎng)絡(luò)安全和意識(shí)形態(tài)安全的關(guān)鍵環(huán)節(jié),是推動(dòng)平臺(tái)經(jīng)濟(jì)健康可持續(xù)發(fā)展的有力保障,是維護(hù)人民群眾利益的具體行動(dòng)。要內(nèi)化導(dǎo)向要求,把準(zhǔn)算法治理“定盤星”,堅(jiān)持黨管互聯(lián)網(wǎng)原則,把主流價(jià)值導(dǎo)向貫穿算法設(shè)計(jì)、開發(fā)、應(yīng)用全過程。要凈化內(nèi)容生態(tài),守好算法應(yīng)用“責(zé)任田”,加強(qiáng)網(wǎng)上正能量推送,嚴(yán)禁算法助推低俗信息傳播,提高算法設(shè)計(jì)的透明度和算法運(yùn)行的可解釋性。
去年11月,中央網(wǎng)信辦等部門聯(lián)合發(fā)布的《關(guān)于開展“清朗·網(wǎng)絡(luò)平臺(tái)算法典型問題治理”專項(xiàng)行動(dòng)的通知》提出,優(yōu)化檢索、排序、推送等規(guī)則的透明度和可解釋性,預(yù)防和減少爭議糾紛。以適當(dāng)方式公示算法推薦服務(wù)的基本原理、目的意圖、主要運(yùn)行機(jī)制等,確保簡單、清晰、可理解。





- 報(bào)料熱線: 021-962866
- 報(bào)料郵箱: news@thepaper.cn
滬公網(wǎng)安備31010602000299號(hào)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證:31120170006
增值電信業(yè)務(wù)經(jīng)營許可證:滬B2-2017116
? 2014-2026 上海東方報(bào)業(yè)有限公司




