【摘要】智能推送過程中的推薦算法有一個認識誤區,就是把“熱度”指標所體現的公眾對一個信息的趣味性的認可,視為公眾認為該信息重要。這實際上是把重要性和趣味性混為一談,把趣味性當成了第一重要的東西,導致其推薦內容過度娛樂化并流向低俗化。
【關鍵詞】智能推送 算法 趣味性 【中圖分類號】G20 【文獻標識碼】A
信息技術進步帶來傳播效率的提升和個人選擇權的擴大
如果我們全面考察人類傳播活動的歷史,就會發現,這個歷史是社會成員個人的信息權不斷擴張的過程。在大眾傳播理論里有一個“選擇性接觸理論”,認為受眾往往并不是不加區別地對待任何媒介和內容,而是更傾向于接觸與自己的既有立場、觀點、態度一致或接近的媒介或內容。在大眾傳播時代,人們看報紙、看電視實際上都是有選擇的。
進入網絡傳播時代,信息技術進步的結果,是媒體個人化以及以此為基礎的信息個人化的進一步加強。無論是搜索引擎,還是推薦引擎,基本原理都是把滿足個人的信息需求放在首位,整體上在強化個人對信息的選擇權。事實上,網絡信息需要點擊打開的呈現方式,本身就賦予了網絡用戶信息選擇的決定權。而基于算法的精準推送技術,更是大大提升了傳播的效率。
美國學者施拉姆在《傳播學概論》中為了解釋個人如何選擇信息傳播路徑,列出了下列公式:
在理想化的智能推送過程中,一方面是將公式中“可能的報償”做到了最大值,因為智能推送的默認邏輯就是向用戶推送他最關心、最感興趣的信息;另一方面,也將用戶獲取信息的“費力的程度”降到了最小值。因為目前智能推送基本都是基于移動互聯網傳播體系,這種新型傳播體系與大眾傳播體系相比,能夠讓用戶以最短的時間、最少的金錢和最小的精力來獲取到這些信息。從這個角度看,智能化的精準推送基本上就是信息選擇“或然率公式”的最優解,它兼備了最大的分子值和最小的分母值,因此具備最大的“選擇或然率”,即用戶對于具備精準推送能力的媒體選擇概率最高。
如果我們從網絡傳播技術對社會成員表達權的影響角度觀察,將會發現,互聯網的普遍賦權特性,使得普通社會成員的表達權得到了更多實現的條件,獲得了更多“積極的自由”。這也是“自媒體”產生和發展的技術基礎。
通過上述考察我們會發現,社會成員個人對信息的選擇權和表達權,隨著信息技術的發展而得到增強,是歷史發展的趨勢,體現著社會的進步,是社會成員個人應該得到尊重的基本權利。在這個意義上,盡管美國學者凱斯·桑斯坦提出“信息繭房”說,對于“公眾只注意自己選擇的東西和使自己愉悅的通訊領域,久而久之,會將自身桎梏于像蠶繭一般的‘繭房’中”表示擔憂,但不能不說,整個社會傳播效率的提升以及社會成員個人的信息主權的強化,更具有進步意義。更何況“信息繭房”說提出的“繭房”效果,也就是由于信息不完全而導致的認知偏差,在大眾傳播過程中,也會由于公眾的選擇性接觸以及媒體“把關人”的特定價值取向而產生。
智能推送技術會產生“內容下降的螺旋”
當前,智能推送技術應用產生的最為人詬病的問題,是低俗和虛假內容常常會被算法選取并加以推送。實踐中,幾乎所有采用這一技術的信息平臺都出現了這一問題。那么,出現這個問題的真正原因是什么?
在智能推送技術中,實際上包含著這樣幾個環節:其一是選擇什么樣的規則處理信息;其二是把采用的規則做成數學模型,即把規則數學化,找到規則涉及的各要素之間的函數關系,確定算法;其三是導入大數據用于機器的深度學習和訓練;其四是使用算法處理大數據。
結合這一算法的運用以及此類平臺運營規則,一些平臺之所以出現部分低俗、虛假內容被推送的狀況,主要有如下原因:
其一,缺乏內容監控的意識和手段。在聚合各種自媒體內容時,資訊平臺為最大規模地占有內容資源,在其發展的特定階段,往往不加甄別地擴充自媒體的內容,這樣就容易造成大量質量不高的內容充斥內容數據庫,使得供給側內容雜蕪,魚目混珠。平臺上這些大量低品質內容的供給,滿足并“創造”著對低俗內容的需求。而資訊平臺以往對此大多缺乏必要的把關意識和技術手段,它們對低俗內容的判斷,主要方式是對文本的情感分析,并結合用戶的負反饋信息,有些平臺甚至在主觀上還企圖借此提高“流量”和用戶數。
其二,算法的取值偏差。目前智能推薦算法主要取值點是熱度,即用戶對一條信息的點擊量,一位資深的算法架構師說“內容熱度信息在大的推薦系統特別在用戶冷啟動的時候非常有效”。這意味著推薦系統的初始設定,基本上都是根據用戶信息點擊的歷史數據判斷其信息偏好而產生的,點擊量高的內容和內容類別會作為初始設定,被推給更多用戶。而用戶使用移動終端的場景近乎個人獨處,具有私密化特征。在這樣的一個狀態下,人們所表現出來的信息需求,常常是獵奇心重,對低俗內容較為敏感,這類低質量信息往往點擊量較高。這就造成了在需求側,平臺通過以往采用的取值方式所采集到的信息需求特征,主要是比較低俗和原始的需求。而如前所述,由于平臺上自媒體數量眾多,且管控手段和意識不強,導致供給側大量充斥著不良內容,通過算法的匹配,以及運營指標和運營機制的引導,就產生了一個下降的螺旋,造成平臺上生成和推送的內容越來越低俗。所以說,是當前的算法取值失當造成了“內容下降的螺旋”。
就上述分析來看,智能推送過程中出現的內容低俗問題不是算法本身導致的,而是平臺在內容聚合過程中缺乏對內容的有效甄別和控制,加之算法取值失當造成的。這類推薦算法有一個共同的認識誤區,就是它們都把“熱度”指標所體現的公眾對一個信息的趣味性的認可,視為公眾認為該信息重要,把公眾對一個信息的興趣,誤當做是這個信息的重要性來進行推薦。客觀全面地分析“熱度”,我們發現,這個指標更多地反映了用戶對于特定信息感興趣的程度,可以映射新聞信息的“趣味性”,但無法反映特定信息對于用戶個人和社會的選擇和決策行為的真正價值,即新聞信息的“重要性”。目前智能推薦的取值法實際上是把重要性和趣味性混為一談,把趣味性當成了第一重要的東西,導致其推薦內容過度娛樂化并流向低俗化。
改進算法,完善甄別信息真偽和優劣的手段,運用現代科技正本清源
盡管基于海量信息聚合,并以算法驅動精準分發的智能推送存在上述問題和局限,而且商業性質的資訊平臺還容易受到逐利動機的影響,從而加劇這些問題,但不可否認的是,算法技術推動了信息傳播方式的顯著進步。
在移動互聯網時代,移動新聞客戶端成為公眾接收新聞信息的主要渠道。移動終端的個人化特點及其便攜性促進了場景化的信息使用,而信息交互讓用戶成為傳播主體。如何實現海量信息資源與個性化信息需求的高效匹配,構成了移動傳播的特殊矛盾。算法技術對傳播方式進步的貢獻在于,它能夠以較高的效率和較低的成本,在社會普遍信息化所產生的海量信息供給中,為個性化需求尋得精準匹配結果。
那么如何優化算法,避免“內容下降的螺旋”呢?我們不能簡單地堆砌現在主流媒體所使用的編輯原則,而是應當以現有編輯原則為基礎,同時結合移動互聯網時代信息分發的規律、公眾接受信息的規律,形成更加具有科學性的算法。這樣一來,我們就可以把對一個事件重要性的社會判斷、個人判斷有機結合,把個人選擇和社會選擇結合起來,讓個人能夠有機會獲得更多的既符合其自身利益,又體現社會主流價值的信息推送。從實踐看,今日頭條等平臺在近期的整改中調整了算法,使容易產生虛假和低俗內容的領域的信息推薦量和閱讀量減少了40%。
要想恰當解決在當前算法應用中出現的問題,不僅需要改進算法,還需要完善甄別信息真偽和優劣的手段,以正本清源。對信息真偽的鑒別,國外的臉書(Facebook)和谷歌、國內的微信和微博大多采用第三方核查的方式,然而,這些方式都屬于事后應對,未能形成預警機制,難以提前防范虛假信息的發布和傳播。隨著各類傳播平臺的用戶規模不斷擴大,虛假信息一旦被廣泛傳播,信息源的資質審查和事后懲罰都難以補償負面輿情效果。因此,傳播之前的攔截具有重要意義。當前,互聯網信息傳播平臺努力的方向,都是借助人工智能技術手段進行事先核查。包括臉書、今日頭條在內的一些平臺近期均大幅度增加了審核人員,正在嘗試以“人工+機器”的模式構建防火墻,以對敏感詞、“標題黨”和虛假信息進行攔截,它們也企圖借助人工智能技術,模仿人腦機制,攔截低俗圖片、視頻等不良內容。今日頭條等平臺還加強了對自媒體賬號及其發布內容的管理,對低俗和虛假信息的產生有較為顯著的遏制作用。
還有一個問題值得我們思考,這就是,在我國的互聯網傳播過程中,是不是商業利益動機過于強烈?互聯網的公共空間應該是公共交往、社會參與的場所,而過于強烈的商業動機會助長不擇手段地追逐經濟利益,從而污染社會輿論環境。互聯網的公共平臺是用來服務公眾的,不是用來個人發財的,這才是公共平臺的價值所在。在這方面澄清觀念,也是正本清源之一種。
(作者為中國人民大學新聞學院教授、博導)
【注:本文系國家社科基金重點項目“以媒介融合推動新型傳播體系的構建研究”(項目批準號:14AZD039)階段性研究成果】
【參考文獻】
①[美]威爾伯·施拉姆著、陳亮等譯:《傳播學概論》,北京:新華出版社,1984年。
②[美]凱斯·R·桑斯坦著、畢竟悅譯:《信息烏托邦:眾人如何生產知識》,北京:法律出版社,2008年。
責編/周素麗 美編/王夢雅