X 在面臨透明度罰款和 Grok 爭議的情況下,公開開源其演算法
2023年,當時名為Twitter的網站首次部分開源其演算法。當時,特斯拉億萬富翁埃隆·馬斯克(Elon Musk)剛剛收購該平台,他聲稱正致力於重組社群媒體平台,使其更加透明。

然而,演算法釋出的程式碼很快被批評為「透明戲碼」,批評者指出其「不完整」,且未透露組織內部運作或程式碼為何會如此運作。
現在,該網站(重新命名為 X)再次開源其演算法,兌現了馬斯克上週的承諾。他曾說:「我們將在7天內將新的X演算法,包括所有用來決定推薦給用戶的有機和廣告貼文的程式碼,開源。」馬斯克也承諾在可預見的未來每四週提供一次演算法透明度。
X 週二在 GitHub 發表文章,提供了一份易於理解的動態源生成程式碼說明,並附上程式運作原理的示意圖。
目前揭露的內容並不算特別驚天動地——但確實讓我們一窺演算法幕後的真相。圖示顯示,當篩選給特定用戶的內容時,網站演算法會考慮他們的互動歷史(點擊過哪些貼文等),並調查近期網路內貼文。它也會基於機器學習分析「網絡外」貼文——也就是用戶不一定追蹤的帳號內容——這些內容被認為用戶可能也會感興趣。

演算法接著會過濾掉某些類型的貼文,包括來自被封鎖帳號或與靜音關鍵字相關的貼文,以及被認為過於暴力或垃圾訊息的內容。演算法會根據它認為使用者會覺得最有吸引力的內容來排名這些內容。這個過程會考慮相關性和內容多樣性等因素,避免用戶收到一堆都一模一樣的貼文。演算法也會根據使用者是否按讚、回覆、轉發、收藏或以其他方式互動的可能性來評估內容。

根據X的說法,整個系統都是基於人工智慧。GitHub 週二發布的文章指出,該系統「完全依賴」公司「基於 Grok 的變換器」來「從使用者互動序列中學習相關性」。換句話說,Grok 會查看你點擊和按讚的內容,並將這些資訊輸入推薦系統。文章也提到,沒有「內容相關性所需的人工特徵工程」,意思是人類不需要手動調整演算法如何判斷什麼是相關的。報告補充說,自動化「大幅降低了我們資料管線與服務基礎設施的複雜性」。
為什麼X現在要揭露這些?這點並不完全清楚。過去,馬斯克曾聲稱他希望讓平台成為企業透明度的典範——這個主題至今仍持續。2023 年,Twitter 演算法首次公開時,Musk 表示提供「程式碼透明度」一開始會「非常尷尬」,但最終會「迅速提升推薦品質」。他補充說:「最重要的是,我們希望贏得您的信任。」隨著首次程式碼開放源源,該平台宣告 Twitter 進入了「透明新時代」。
雖然馬斯克談到透明度,但自從他接手平台後,某些面向可以說變得不那麼開放。當這位科技億萬富翁於2022年收購Twitter時,該網站明顯被迫從上市公司轉型為私人公司——這種演變通常不等同於開放。雖然該網站過去每年會發布多份透明度報告,但 X 直到 2024 年 9 月才發布了第一份透明度報告。去年12月,歐盟監管機構也對X處以1.4億美元罰款,指控該網站違反了《數位服務法》(DSA)下的「透明度義務」,並主張網站的驗證勾選系統使用戶更難判斷特定帳號的真實性。
過去一個月,X 也因聊天機器人 Grok 被用來創作和散布性內容而承受壓力。加州檢察長辦公室和國會議員近幾週都對該平台進行了嚴格審查,並引用了 Grok 被用來製作女性和未成年裸體影像的指控。因此,有些人可能將這種對開放的訴求視為更多的戲劇。
