抖音4月15日在北京舉辦“安全與信任中心開(kāi)放日”活動(dòng),相關(guān)業(yè)務(wù)負(fù)責(zé)人就抖音算法原理、平臺(tái)治理體系等社會(huì)關(guān)切的問(wèn)題進(jìn)行了詳細(xì)介紹,揭秘算法如何幫助用戶打破“信息繭房”。
據(jù)介紹,推薦算法作為人工智能機(jī)器學(xué)習(xí)技術(shù)的重要應(yīng)用場(chǎng)景,本質(zhì)上是一套高效的信息過(guò)濾系統(tǒng)。在抖音的實(shí)際應(yīng)用中,推薦系統(tǒng)采取“人工+機(jī)器”協(xié)同的方式進(jìn)行風(fēng)險(xiǎn)治理,始終有人工運(yùn)營(yíng)和治理體系為算法導(dǎo)航。同時(shí)多目標(biāo)體系算法能主動(dòng)打破 “信息繭房”,為用戶帶來(lái)更豐富多元、實(shí)用可靠的推薦結(jié)果。
抖音算法工程師劉暢介紹,抖音的推薦算法與國(guó)內(nèi)外大部分內(nèi)容推薦平臺(tái)相似,包含召回、過(guò)濾、排序等環(huán)節(jié),重點(diǎn)是學(xué)習(xí)用戶行為。抖音基于用戶行為的推薦方法包含多種技術(shù)模型,如協(xié)同過(guò)濾、雙塔召回、Wide&Deep模型等。算法可以在用戶完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶,把其他人感興趣的內(nèi)容推薦給該用戶。目前,抖音算法已幾乎不依賴對(duì)內(nèi)容和用戶打標(biāo)簽,而是通過(guò)神經(jīng)網(wǎng)絡(luò)計(jì)算,預(yù)估用戶行為,計(jì)算用戶觀看這條內(nèi)容獲得的價(jià)值總和,把排名靠前的內(nèi)容推給用戶。
抖音算法工程師劉暢介紹算法原理
“用戶長(zhǎng)期價(jià)值,是抖音推薦算法的‘北極星指標(biāo)’,也就是我們最核心的業(yè)務(wù)目標(biāo)。”劉暢表示,抖音更關(guān)注用戶長(zhǎng)期價(jià)值,而非追求平臺(tái)的短期數(shù)據(jù)。為此,抖音算法考慮了眾多目標(biāo),如完播、評(píng)論、點(diǎn)贊、對(duì)作者長(zhǎng)期消費(fèi)、分享、跟拍等,力圖計(jì)算出更符合用戶長(zhǎng)期價(jià)值的目標(biāo)。
為引導(dǎo)算法打破“信息繭房”,抖音算法在多目標(biāo)建模體系下,設(shè)置了專門的探索維度。一是對(duì)用戶在平臺(tái)上已經(jīng)表現(xiàn)出的興趣,盡可能推薦更多樣的內(nèi)容,通過(guò)多樣性打散、多興趣召回、扶持小眾(長(zhǎng)尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次。二是幫助用戶探索更多新興趣,采用隨機(jī)推薦、基于用戶社交關(guān)系拓展興趣、搜索推薦聯(lián)動(dòng)、“不感興趣”不再展現(xiàn)等多種方式,讓用戶的主動(dòng)行為影響推薦系統(tǒng),使推薦更加個(gè)性化和多樣化。
抖音算法主動(dòng)打破“繭房”:推薦給朋友、不感興趣、屏蔽關(guān)鍵詞頁(yè)面
算法能學(xué)習(xí)、預(yù)估用戶行為,但因其無(wú)法理解內(nèi)容語(yǔ)義,對(duì)內(nèi)容的理解存在不足,可能導(dǎo)致違法違規(guī)、不良內(nèi)容被推薦傳播。因此,算法在真實(shí)使用場(chǎng)景中,必須由平臺(tái)治理對(duì)其進(jìn)行約束和規(guī)范。
抖音生態(tài)運(yùn)營(yíng)經(jīng)理陳丹丹介紹,抖音的內(nèi)容治理體系是“人工參與+機(jī)器學(xué)習(xí)”相結(jié)合的模式,并組建了專門的平臺(tái)治理團(tuán)隊(duì)為算法設(shè)置“護(hù)欄”。
抖音生態(tài)運(yùn)營(yíng)經(jīng)理陳丹丹介紹平臺(tái)治理體系
抖音平臺(tái)治理體系包括異常感知、標(biāo)準(zhǔn)定義、機(jī)器識(shí)別、人工研判、風(fēng)險(xiǎn)處置等過(guò)程。治理流程秉持兩大準(zhǔn)則,一是所有在平臺(tái)發(fā)布的內(nèi)容都會(huì)經(jīng)過(guò)評(píng)估,流量越高的內(nèi)容評(píng)估次數(shù)越多,標(biāo)準(zhǔn)也越嚴(yán)格;二是抖音內(nèi)容審核采用“人工+機(jī)器”相互配合的模式,“機(jī)器”負(fù)責(zé)“寬度”評(píng)估所有投稿,“人工”負(fù)責(zé)“深度”,確保專業(yè)、敏感或疑難等問(wèn)題盡可能精準(zhǔn)研判。
抖音內(nèi)容治理采取“人工參與+機(jī)器學(xué)習(xí)”相結(jié)合的模式
創(chuàng)作者將內(nèi)容上傳至抖音后,首先進(jìn)入機(jī)器識(shí)別環(huán)節(jié)。如果內(nèi)容被識(shí)別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問(wèn)題,則會(huì)送至人工審核;若問(wèn)題概率較低,則獲得基礎(chǔ)流量進(jìn)入下一環(huán)節(jié)。視頻被舉報(bào)、評(píng)論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況出現(xiàn),均可能觸發(fā)“人工+機(jī)器”審核。一旦內(nèi)容在任一環(huán)節(jié)被處置,系統(tǒng)會(huì)立即停止進(jìn)一步推薦和分發(fā)。
據(jù)了解,針對(duì)社會(huì)普遍關(guān)心的、對(duì)用戶造成較多困擾的焦點(diǎn)問(wèn)題,抖音成立了數(shù)個(gè)專項(xiàng)治理團(tuán)隊(duì),針對(duì)詐騙、網(wǎng)暴、虛假擺拍、未成年人保護(hù)、網(wǎng)絡(luò)水軍、AIGC技術(shù)濫用等一系列重大專項(xiàng)風(fēng)險(xiǎn)進(jìn)行治理。例如,在不實(shí)信息治理方面,抖音于近日上線了辟謠卡,遏制不實(shí)信息的傳播。
目前,抖音安全與信任中心網(wǎng)站處于試運(yùn)行階段,正廣泛向用戶、創(chuàng)作者、社會(huì)各界征集意見(jiàn)。此次開(kāi)放日活動(dòng),旨在鼓勵(lì)廣大公眾體驗(yàn)抖音安全與信任中心,了解算法原理、機(jī)制和治理政策,共建平等友善、記錄美好的社區(qū)。除了闡釋算法、治理等議題,抖音安全與信任中心網(wǎng)站也公布了平臺(tái)倡導(dǎo)的社區(qū)價(jià)值,以及對(duì)優(yōu)質(zhì)內(nèi)容的定義。對(duì)于讓用戶有收獲、有驚喜、有共鳴的優(yōu)質(zhì)內(nèi)容,抖音增加了專門的推薦子鏈路,這些標(biāo)記為優(yōu)質(zhì)內(nèi)容子品牌“抖音精選”的內(nèi)容,均有機(jī)會(huì)獲得流量扶持。
抖音表示,未來(lái)將堅(jiān)定推進(jìn)各項(xiàng)舉措,讓算法更透明、治理更完善、服務(wù)更到位,并以安全與信任中心為依托,持續(xù)增加算法和治理透明度,回應(yīng)社會(huì)關(guān)切的議題,主動(dòng)公示違規(guī)案例治理情況,接受公眾監(jiān)督。
記者 李志勇