超鹏在线免费草每AV,精品乱伦五月性爱第二页,老司机日韩欧美网站

在向量空間中，其匿名發(fā)布的信息可能與其真實(shí)身份極其接近，但事實(shí)截然相反。大語(yǔ)言模型此時(shí)就可以像人類一樣，利用這些明顯的矛盾排除高相似度的錯(cuò)誤選項(xiàng)。

對(duì)于真實(shí)世界的安全攻擊來(lái)說(shuō)，必須遵循一條規(guī)律：寧可漏報(bào)，絕不誤報(bào)。因此，校準(zhǔn)環(huán)節(jié)必須解答一個(gè)問(wèn)題：大語(yǔ)言模型已經(jīng)找到了人，但這個(gè)結(jié)果是否值得相信？

套用到實(shí)際的應(yīng)用場(chǎng)景中很容易理解：出于好奇心，從一個(gè)人匿名發(fā)布的內(nèi)容推測(cè)這個(gè)人是誰(shuí)，一旦判斷錯(cuò)了不僅前功盡棄，還容易引起不必要的尷尬。

因此，讓大語(yǔ)言模型匹配匿名信息與真實(shí)身份，要么結(jié)果正確，要么沒(méi)有結(jié)果，絕不允許出現(xiàn)錯(cuò)誤的匹配。

在大語(yǔ)言模型推理完成后，攻擊者就會(huì)得到許多匹配結(jié)果，一個(gè)匿名賬號(hào)對(duì)應(yīng)一個(gè)真實(shí)身份，暫且把它記作一對(duì)。成千上萬(wàn)對(duì)匹配結(jié)果中，必然有錯(cuò)有對(duì)。

為了解決向量相似度不靠譜和模型推理可能遺漏細(xì)微矛盾點(diǎn)等問(wèn)題，研究團(tuán)隊(duì)特意添加了一輪校準(zhǔn)機(jī)制：

他們又設(shè)置了一個(gè)價(jià)格稍低的模型充當(dāng)裁判，并讓匹配結(jié)果中的每一對(duì)進(jìn)行1v1的PK。作為裁判的模型要回答其中哪一對(duì)看起來(lái)更像是同一個(gè)人。

每一輪PK后，系統(tǒng)根據(jù)結(jié)果更新每一對(duì)匹配結(jié)果的評(píng)分。在經(jīng)過(guò)幾千次的比較后，最終得到一個(gè)極其可靠的置信度排名。

結(jié)果顯示，這種方法能夠極大程度上提高在99%以上精確率下的系統(tǒng)召回率，讓匹配關(guān)系更加可靠。

去匿名化的實(shí)驗(yàn)結(jié)果：全面擊潰

為了評(píng)估ESRC框架是否有效，Anthropic的研究團(tuán)隊(duì)設(shè)計(jì)了三個(gè)模擬真實(shí)世界的場(chǎng)景，結(jié)果令人有些害怕。

研究團(tuán)隊(duì)首先構(gòu)建了一個(gè)具備網(wǎng)絡(luò)搜索功能的大語(yǔ)言模型Agent，并試圖讓它將脫敏后的極客論壇賬號(hào)與真實(shí)LinkedIn職場(chǎng)身份進(jìn)行關(guān)聯(lián)。

這個(gè)實(shí)驗(yàn)與人肉搜索的過(guò)程幾乎完全一致，攻擊者只需要提供脫敏后的極客論壇檔案，該Agent就能自主生成搜索詞、調(diào)用搜索引擎并交叉比對(duì)從網(wǎng)頁(yè)中獲得的證據(jù)。

研究團(tuán)隊(duì)設(shè)計(jì)的準(zhǔn)確率要求是90%，在此基礎(chǔ)下該Agent竟然成功還原了67%的用戶身份，耗時(shí)只有短短幾分鐘。

更可怕的是，平均下來(lái)每位用戶的搜索成本只有1-4美元！

這就意味著，大規(guī)模、高定制化的“人肉搜索”在經(jīng)濟(jì)上已經(jīng)具備可行性。

接下來(lái)有人可能會(huì)想，真實(shí)的職場(chǎng)身份容易被發(fā)現(xiàn)，那如果是不同平臺(tái)的兩個(gè)匿名小號(hào)呢？

為了模擬同一用戶在不同平臺(tái)的兩個(gè)匿名小號(hào)，研究團(tuán)隊(duì)將Reddit用戶發(fā)布的帖子分為兩類：一類是綜合電影板塊，一類是小眾電影板塊。

但結(jié)果仍然令人驚訝：即便是沒(méi)有年齡、職業(yè)等容易形成強(qiáng)關(guān)聯(lián)的隱私數(shù)據(jù)，只有主觀的電影評(píng)價(jià)和審美偏好，ERSC框架也能將兩個(gè)小號(hào)精準(zhǔn)關(guān)聯(lián)。

冰冷的數(shù)據(jù)顯示，同一個(gè)用戶只要在兩個(gè)匿名小號(hào)中共同提到過(guò)10部電影，被精準(zhǔn)關(guān)聯(lián)的概率就已經(jīng)達(dá)到48.1%。

還有人會(huì)說(shuō)，人的愛好和討論熱點(diǎn)是會(huì)變的，過(guò)去的賬號(hào)和現(xiàn)在的新賬號(hào)壓根不相關(guān)。

研究團(tuán)隊(duì)將1萬(wàn)名用戶的評(píng)論以1年為期進(jìn)行劃分，一年前的言論作為查詢集，一年后的言論作為候選池。

實(shí)驗(yàn)證明，即便是完全不同時(shí)期的社會(huì)新聞和話題，大語(yǔ)言模型還是能見微知著，從寫作風(fēng)格、興趣甚至是人口統(tǒng)計(jì)特征，從包含數(shù)千名干擾者的候選池中準(zhǔn)確找到用戶“過(guò)去的自己”。

去匿名化的現(xiàn)狀：無(wú)法防御

無(wú)論是2008年的Netflix事件，還是Anthropic研究團(tuán)隊(duì)的模擬實(shí)驗(yàn)，我們會(huì)發(fā)現(xiàn)數(shù)據(jù)規(guī)模其實(shí)并不大。

一個(gè)最直觀且正確的想法是：通過(guò)精準(zhǔn)匹配實(shí)現(xiàn)去匿名化的難度取決于候選池的大小。

若是將候選的真實(shí)身份擴(kuò)充到百萬(wàn)、千萬(wàn)級(jí)，采用ERSC框架的攻擊手段是否還能生效？

傳統(tǒng)統(tǒng)計(jì)算法顯然不行，哪怕是幾百人的情況下都會(huì)崩潰，召回率直接歸零；

但基于大語(yǔ)言模型的ERSC攻擊不一樣，它展現(xiàn)出了恐怖的對(duì)數(shù)線性衰減特性，即便是百萬(wàn)人，大語(yǔ)言模型仍然能在90%精確度的水平下保持35%的召回率。

更可怕的是，這種攻擊手段，用戶無(wú)法防御，平臺(tái)也無(wú)法防御。

對(duì)于用戶來(lái)說(shuō)，傳統(tǒng)的隱私保護(hù)手段大多是為了結(jié)構(gòu)化數(shù)據(jù)而設(shè)計(jì)的。

我們可以把年齡模糊成年齡段，可以把定位服務(wù)關(guān)掉避免位置信息被獲取。

但生活和網(wǎng)絡(luò)中，一個(gè)人總得說(shuō)話。哪怕是用最高級(jí)的文本凈化技術(shù)來(lái)脫敏，大語(yǔ)言模型仍然能從這些非結(jié)構(gòu)化文本和上下文語(yǔ)境中推斷出些許特征。

對(duì)于平臺(tái)來(lái)說(shuō)，無(wú)法從API層面上封殺這種攻擊手段。

平臺(tái)看到黑客針對(duì)漏洞進(jìn)行攻擊，可以用防火墻攔截；但如果平臺(tái)看到用戶的請(qǐng)求是“幫我看看這兩段電影評(píng)價(jià)哪個(gè)寫的更好”呢？

攻擊手段恰恰就包含在這些看起來(lái)完全正常的用戶請(qǐng)求之中，模型提供商根本無(wú)法判斷調(diào)用者是在進(jìn)行去匿名化攻擊還是在正常工作。

至此，網(wǎng)絡(luò)安全領(lǐng)域的防御成本和攻擊成本的非對(duì)稱性已經(jīng)被徹底逆轉(zhuǎn)。

結(jié)語(yǔ)

以前，我們面對(duì)互聯(lián)網(wǎng)總是會(huì)想：我不過(guò)是個(gè)普通人，誰(shuí)會(huì)閑的沒(méi)事扒我的馬甲？

隱藏在商業(yè)世界中的變現(xiàn)邏輯恐怕不會(huì)這么想。

如果我們把目光拉回到剛剛過(guò)去的春節(jié)，國(guó)內(nèi)幾家頭部大模型平臺(tái)無(wú)一例外地推出了AI助手的激勵(lì)政策。

無(wú)論是元寶派的現(xiàn)金紅包，還是千問(wèn)的免費(fèi)奶茶，幾家平臺(tái)砸下數(shù)十億現(xiàn)金的猛烈營(yíng)銷使得其產(chǎn)品在春節(jié)期間的日活數(shù)據(jù)飆升，但假期一過(guò)，留存率卻相當(dāng)慘淡。

按照過(guò)往的互聯(lián)網(wǎng)運(yùn)營(yíng)思維來(lái)看，這當(dāng)然談不上是什么成功的拉新活動(dòng)。各家的錢都沒(méi)少燒，ROI卻不見起色，用戶薅完羊毛心滿意足地轉(zhuǎn)身離去，產(chǎn)品還是沒(méi)多少人主動(dòng)用。

或許，這不是一次失敗的拉新營(yíng)銷，而是一場(chǎng)披著春節(jié)外衣的大規(guī)模微數(shù)據(jù)收割行動(dòng)。

了解拜年話術(shù)、查詢年夜飯菜譜、制定旅行規(guī)劃、訂購(gòu)?fù)赓u奶茶、甚至是編寫復(fù)工請(qǐng)假理由。

這些非結(jié)構(gòu)化的自然語(yǔ)言，在用戶看來(lái)只是閑聊，在傳統(tǒng)算法面前只是幾句廢話。

但在普遍擁有ESRC能力的AI公司看來(lái)，這些信息就意味著價(jià)值，而大語(yǔ)言模型正是發(fā)現(xiàn)價(jià)值的顯微鏡。

AI公司并不需要用戶高度留存，相反，只要用戶點(diǎn)開對(duì)話框，哪怕只用了幾分鐘聊了幾句，大語(yǔ)言模型就能從簡(jiǎn)短而模糊的需求中精確提取出年齡、常住地、職業(yè)、家庭結(jié)構(gòu)、消費(fèi)能力甚至性格等高價(jià)值信息。

在AI公司手里，ESRC框架的攻擊手段正是精準(zhǔn)描繪用戶畫像的最強(qiáng)武器。

過(guò)去，字節(jié)可能需要分析過(guò)去一個(gè)月用戶看過(guò)的抖音短視頻、騰訊可能要分析用戶在微信看過(guò)的一千篇?dú)v史文章、阿里可能要分析用戶在淘寶購(gòu)買的上百個(gè)產(chǎn)品，才能模模糊糊拼湊出用戶大概是個(gè)什么樣的人。

而如今，憑借著大語(yǔ)言模型已經(jīng)溢出的語(yǔ)義理解和推理能力，僅靠幾次不經(jīng)意之間的對(duì)話碎片，AI就可以輕松在海量數(shù)據(jù)中完成精準(zhǔn)的“去匿名化”定位。

這些被提取出來(lái)的高質(zhì)量用戶標(biāo)簽，正是實(shí)現(xiàn)精準(zhǔn)的廣告投流、跨平臺(tái)數(shù)據(jù)變現(xiàn)以及未來(lái)模型的訓(xùn)練最寶貴的資產(chǎn)。

總之，無(wú)論如何我們都只能接受一個(gè)事實(shí)：長(zhǎng)期以來(lái)，支撐互聯(lián)網(wǎng)自由表達(dá)的匿名機(jī)制，在LLM面前已經(jīng)失去了意義。

本文系作者硅基星芒授權(quán)鈦媒體發(fā)表，并經(jīng)鈦媒體編輯，轉(zhuǎn)載請(qǐng)注明出處、作者和本文鏈接。
本內(nèi)容來(lái)源于鈦媒體鈦度號(hào)，文章內(nèi)容僅供參考、交流、學(xué)習(xí)，不構(gòu)成投資建議。
想和千萬(wàn)鈦媒體用戶分享你的新奇觀點(diǎn)和發(fā)現(xiàn)，點(diǎn)擊這里投稿。創(chuàng)業(yè)或融資尋求報(bào)道，點(diǎn)擊這里。

快報(bào)

2026-03-26 23:08

國(guó)內(nèi)商品期貨夜盤收盤多數(shù)上漲，對(duì)二甲苯期貨主力合約漲1.95%

2026-03-26 23:07

部分船舶通過(guò)伊朗“管控系統(tǒng)”通行霍爾木茲海峽

2026-03-26 23:07

五一視界2025年?duì)I收增21%，發(fā)布全球首款“物理直覺”世界模型

2026-03-26 23:00

伊拉克南部油田產(chǎn)量暴跌8成

2026-03-26 22:59

華虹公司：2025年凈利潤(rùn)3.77億元，同比下降1.04%

2026-03-26 22:49

日本本州東部遠(yuǎn)海發(fā)生6.3級(jí)地震，震源深度10千米

2026-03-26 22:37

華虹半導(dǎo)體擬更名為“華虹宏力”，統(tǒng)一滬港兩地證券簡(jiǎn)稱

2026-03-26 22:28

具身智能領(lǐng)域首個(gè)行業(yè)標(biāo)準(zhǔn)正式發(fā)布

2026-03-26 22:27

美國(guó)解除對(duì)白俄羅斯十余家實(shí)體制裁

2026-03-26 22:25

中國(guó)國(guó)航：2025年凈虧損17.7億元，同比大幅擴(kuò)大

2026-03-26 22:12

興業(yè)銀行：2025年凈利潤(rùn)774.69億元，同比增長(zhǎng)0.34%

2026-03-26 22:08

國(guó)際奧委會(huì)明確：奧運(yùn)女子組賽事僅限生理女性參加

2026-03-26 22:08

96個(gè)中央部門集中向社會(huì)公開預(yù)算

2026-03-26 21:58

Meta股價(jià)觸及2025年5月以來(lái)最低水平，最新下跌2.6%

2026-03-26 21:51

美團(tuán)財(cái)報(bào)電話會(huì)：預(yù)計(jì)Q1餐飲外賣的單均虧損環(huán)比優(yōu)化幅度會(huì)好于Q4

2026-03-26 21:42

伊朗通過(guò)中間人回應(yīng)美15點(diǎn)?；鹛嶙h，提出明確前提條件

2026-03-26 21:41

國(guó)臺(tái)辦回應(yīng)臺(tái)灣民眾黨前主席柯文哲一審被判17年

2026-03-26 21:34

納斯達(dá)克中國(guó)金龍指數(shù)跌超2%

2026-03-26 21:31

美股開盤：三大指數(shù)集體低開，芯片存儲(chǔ)板塊普跌

2026-03-26 21:29

云南銅業(yè)：2025年凈利潤(rùn)同比下降7.31%，擬10派2.3元

去匿名化的實(shí)驗(yàn)結(jié)果：全面擊潰

去匿名化的現(xiàn)狀：無(wú)法防御

結(jié)語(yǔ)

敬原創(chuàng)，有鈦度，得贊賞

敬原創(chuàng)，有鈦度，得贊賞