![]()
▲用Perplexity搜索“谷歌前CEO Eric Schmidt的AI無人戰(zhàn)斗機”,Perplexity的回答出現(xiàn)了問題,P2為Perplexity引用的網(wǎng)址,該網(wǎng)頁刊登AI生成文章的網(wǎng)頁
為了更好地了解GPTZero打假AI的能力,烏鴉君將不同類型的內(nèi)容交給GPTZero識別。從結(jié)果來看,GPTZero基本能夠準確分辨人或者AI創(chuàng)作的內(nèi)容。
![]()
比如,在我的提示下,GPT-4創(chuàng)作了小故事《西游記新編(一)》,GPTZero準確地檢測出AI內(nèi)容(AI生成內(nèi)容占比100%)。另外,對于Claude和文心一言創(chuàng)作的內(nèi)容,GPTZero也能夠得出較準確的結(jié)論。
而面對AI和人類共同創(chuàng)作的內(nèi)容,比如我和GPT-4共同撰寫的小故事《西游記新編(二)》,GPTZero識別的結(jié)果會相對偏離真實情況。
說起來,GPTZero的工作原理其實并不復(fù)雜,就是通過AI算法分析文本的復(fù)雜度和模式,從而判斷其可能的來源。
烏鴉君將其翻譯成下面這個秘訣,記住它,你也能變成一眼識AI:
越簡單的文字越可能是AI寫的,越難懂的文字越可能是人類寫的。
對比AI來說,人類寫出的東西的不難被理解,而且還會不自然。這有些逆反普通人的認知了。當GPTZero對一段文字的困惑越多,說明這篇文章越接近人類寫作的特征。
原因在于,AI生成的文本內(nèi)容,文字會更可能通順而自然,也更容易預(yù)測,不會給GPTZero造成理解障礙。而人類的寫作則不同,它往往會包含更具創(chuàng)意的詞語選擇,甚至偶爾還會出現(xiàn)拼寫錯誤等問題,會讓GPTZero萌生出多個問號。
還有一個識別AI的訣竅,就是人類寫作的節(jié)奏感,AI學(xué)不來。
文字的節(jié)奏感,指的是人們文字在表達過程中通過聲調(diào)、節(jié)奏、押韻等方式所形成的音樂感和流暢感。這東西AI根本學(xué)不會,AI比人類偏好書寫句子長度平均、結(jié)構(gòu)常規(guī)、風(fēng)格單調(diào)的東西。
說完了訣竅,我們看看GTPZero還有哪些功能。除了最核心的AI文本內(nèi)容檢測外,GTPZero還內(nèi)置了“人類寫作認證”,這是他們基于專有寫作模式分析器推出的功能(認證文檔確實由人類寫作,而非AI生成)。
GPTzero在去年1月走紅,最初的客戶是教師群體,宣稱自己可以幫忙檢測AI生成的學(xué)生作業(yè),到如今,GPTZero的客戶群體已經(jīng)從單一的教師群體擴展為,政府采購機構(gòu)、慈善機構(gòu)、招聘經(jīng)理、數(shù)據(jù)標注員等。
GPTZero將遠期目標定位于AI幻覺檢測。由于幻覺是生成式AI行業(yè)的難以根除的問題,這家公司預(yù)備推出基于LLM訓(xùn)練數(shù)據(jù)集的免費AI文本版權(quán)檢查,幫助他們生成更廣泛的幻覺檢測訓(xùn)練數(shù)據(jù)。
隨著AI生成創(chuàng)新工具集中爆發(fā),AI假圖假視頻盛行。
從去年開始,AI打假應(yīng)用發(fā)展迅猛,可檢測的類型涵蓋文字、圖片、視頻、音頻等內(nèi)容形態(tài),技術(shù)涉及分類器、水印和元數(shù)據(jù)等。
除了剛剛提過的文字檢測工具,在圖像檢測領(lǐng)域,也出現(xiàn)了許多檢測圖像的真實性、來源以及是否經(jīng)過篡改的反AI工具。比如通過分析圖像的像素特征、元數(shù)據(jù)、與已知數(shù)據(jù)庫的對比等方式來進行判斷,例如AI or Not和Nuanced。
在聲音、音頻內(nèi)容檢測工具方面,有以下一些技術(shù)可以實現(xiàn),如基于音頻特征分析(細分為韻律特征、頻譜特征分析),還有利用機器學(xué)習(xí)和深度學(xué)習(xí)模型(細分為訓(xùn)練分類器、異常檢測)等。例如Project Mockingbird(聲音檢測)、AI-generated Detector(音樂檢測)
以下是一些烏鴉君認為值得關(guān)注的AI檢測型工具:
1、多媒體內(nèi)容審核工具Hive AI,打擊電商虛假宣傳
AI生成時代,可能會讓虛假宣傳更加猖獗。就拿網(wǎng)購來說,如果大量商家使用AI生成式圖片,普通人可能會相信虛假的效果而去購買商品。商家有必要去克制AI假圖、假視頻在購物平臺上的含量。
Hive AI就是當下較為全能的AI檢測工具,無論是文本、圖像還是視頻,都能幫助客戶識別AI內(nèi)容。通過將上傳的照片與在線文本材料、圖片、視頻庫進行對比,找出AI生成的內(nèi)容。
Hive AI如今已經(jīng)有各種各樣的使用案例,主要應(yīng)用于社交和電子商務(wù)平臺,比如支付平臺Visa、網(wǎng)劇平臺Netflix、社交平臺Reddit。憑借在多個平臺進行識別的優(yōu)勢,Hive AI在去年完成新一輪2億美元融資(但信息未公開)。
2、高端多媒體檢測工具AI or Not,已獲10萬用戶
AI or Not是面向新聞媒體、社交平臺、電子商務(wù)的多媒體檢測工具,和上述工具不同的是,它能提供詳細的分析報告。
具體來說,AI or Not可以分析文本內(nèi)容,識別是否由AI生成,如GPT-3或其他語言模型。圖片方面,它可以利用深度學(xué)習(xí)技術(shù)檢測圖像是否經(jīng)過AI生成或編輯,識別深偽(Deepfake)圖像,也就是說,它對AI圖像檢測的力度更大。
另外,它也可以分析視頻內(nèi)容,檢測是否經(jīng)過AI生成或修改,如Deepfake視頻。提供幀級別的分析,確保檢測結(jié)果的準確性和細節(jié)。
目前月度收費為個人版5美元/月,企業(yè)版250美元/月。該收費工具目前已經(jīng)獲得了10萬用戶,看來國外比較愿意為這種社交內(nèi)容打假付費。
![]()
▲使用范例
3、監(jiān)控也要防范AI造假,Nuanced準確率高達97%
相比上面主要面向深度仿真、藝術(shù)原創(chuàng)性的AI or Not,Nuanced更適用于超市監(jiān)控、貨物倉儲情況等對圖像質(zhì)量要求不高的低端場景。
Nuanced這個詞本身有“微妙的”“具有細微差別的”的意思。也就是說,Nauanced可以對一段監(jiān)控報告視頻進行精細的檢測。具體來說,Nauanced不只是檢測人和貨物,還能辨別細微差別,例如面部表情、人們之間的互動以及環(huán)境背景。
另外,Nuanced實時高效處理大量圖像,適合在線和離線應(yīng)用。
4、預(yù)防電話詐騙,檢測工具Project Mockingbird準確率達90%
AI聲音的影響可能比我們想象中得更大,不法分子盯上老年人,利用AI生成的聲音進行詐騙。央視網(wǎng)報道,去年11月,有騙子用AI生成的受害者親人的聲音詐騙,騙去40萬。
殺毒軟件McAfee公司推出聲音檢測工具Project Mockingbird,幫助用戶檢測、阻止AI生成的語音詐騙行為的項目。它基于由AI驅(qū)動的 “深度偽造” 音頻檢測技術(shù),在聆聽給定的語音之后,可檢測音頻是否為真人發(fā)音。
為了在視頻中精準定位并識別可能由AI生成的音頻片段,Project Mockingbird還融合了 AI 驅(qū)動的上下文、行為和分類檢測模型。官方聲稱該工具成功率超過90%,目前還不向用戶收取額外費用。
5、一分鐘掃5000首歌,幫助唱片平臺防止發(fā)布的AI音樂侵權(quán)
AI生成的音樂一直伴隨著版權(quán)爭議,就連OpenAI都有暗示過GPT-4o生成的音樂可能會侵犯別的音樂的版權(quán)。
音樂發(fā)行商如何自我防范?現(xiàn)在已經(jīng)有專門檢測AI生成式音樂的工具——AI-Generated Detecto,這項工具一分鐘內(nèi)可以掃描5000首曲目!并保證準確率高達98.5%。
這是巴黎蓬皮杜音樂技術(shù)研究中心IRCAM的IRCAM Amplify公司推出的識別AI生成音樂的工具,目標客戶主要是唱片公司、出版商、版權(quán)管理組織和音樂流媒體平臺。
![]()
快報
根據(jù)《網(wǎng)絡(luò)安全法》實名制要求,請綁定手機號后發(fā)表評論
用AI打假AI火爆起來了
有點像AI生成的殺毒軟件
人類寫作的節(jié)奏感,AI學(xué)不來
對比AI來說,人類寫出的東西不難被理解
AI生成的內(nèi)容過于公式化