av大片免费观看-av大片免费看-国产精品国产三级国产普通话蜜臀-国产精品国产三级国产在线观看-久久福利小视频-久久福利一区-欧美日韩二区三区-欧美日韩福利-色婷婷成人网-色婷婷导航-亚洲男人天堂影院-亚洲男人网-2018年亚洲欧美在线v-亚洲香蕉aⅴ视频在线播放-少妇爆乳无码专区网站-亚洲aⅴ天堂av在线电影

你刷抖音小紅書不會變笨,但你的 AI 會_信息

好消息:AI 越來越好用了。

壞消息:越用它越笨。

無論是哪家 AI 廠商,現在都會在「長期記憶」「超長上下文儲存」等方面下功夫,這樣才能讓用戶用起來順手、順心。不過,最近一項研究發現,AI 未必就能越用越懂你、越用越聰明,還可能往反方向跑偏。


(相關資料圖)

AI 也會認知退化?還不可逆?

研究者們用開源模型(如 LLaMA 等),做了一個小但精巧的實驗。他們不是簡單地在訓練數據里混入一些錯別字,而是想要模擬人類那種「無休止地刷著低質量、碎片化內容」的互聯網生活,并用「持續預訓練」(Continual Pre-training)的方式來模擬模型的長期暴露。

為了實現這個目標,他們從真實的社交媒體平臺上篩選了兩種「垃圾數據」,一種是「參與度驅動型垃圾」,也就是那些短平快、高人氣、點贊和轉發爆炸的帖子,類似于我們刷手機時那些只為博眼球的「流量密碼」。

另一種是語義質量驅動型垃圾,那些充斥著「震驚」、「細思極恐」、「xxx 不存在了」這種夸張、聳動字眼的內容。他們將這些垃圾語料以不同的比例混合,持續喂食給模型,模擬劑量對「腦腐爛」的影響。

隨后,他們讓好幾個大語言模型持續地、長時間地被投喂這些垃圾,作為訓練語料。再用一系列基準測試來衡量 LLM 的「認知功能」,包括推理能力、長文本理解能力、安全性和道德判斷,等等。

結果是:全面完蛋。模型的推理能力和長文本理解力出現了斷崖式下跌,在處理復雜的邏輯推理任務和長篇幅內容時,表現出明顯的退化。

當垃圾數據的比例從 0%提升到 100%時,模型的推理準確率急劇下降。這反映出模型越來越「懶得思考」,也越來越「記不住事」。

到底是什么原因呢?研究者深入分析后,發現了一個主要病灶:Thought-Skipping。

原本,一個優秀的 LLM 在解決復雜問題時,會生成一步步的中間推理過程;但在被「垃圾」腐蝕后,模型開始跳過這些中間步驟,直接給出一個粗糙的、可能是錯誤的答案。

就像一個原本邏輯縝密的律師,突然變得浮躁、敷衍,不再提供論證過程,而是隨口丟出一個結論。

甚至,評估發現,模型在安全和倫理方面的表現也下降了,更容易屈服于負面 prompt,逐漸「黑化」。

這說明,當模型持續接觸碎片化、煽動性的低質量文本時,它不僅能力下降,連「三觀」也開始向互聯網的平均值,甚至是「陰暗面」靠攏。

如果說這項研究里什么最讓人倒吸涼氣,恐怕就是整個過程的不可逆性。

研究員試圖在中途進行補救,重新投喂了大量高品質的數據,還做了指令微調。但即便如此,模型的認知能力也無法完全恢復到最初的基線水平。

也就是說,垃圾數據已經從根本上改變了模型處理信息、構建知識的底層結構,這就像一塊海綿被污水泡透了,即便再用清水清洗,也無法回到最初的純凈狀態。

橫掃「腦腐」,用好 AI

可是話說回來,這畢竟是實驗,一個普通用戶的「破壞力」應該不至于吧。

的確,沒有人會故意給自己的 chatbot 喂垃圾數據,還如此大量高頻。不過,這個實驗的數據來源,正是社交媒體平臺。

識別、抓取和總結社交媒體內容,是大模型產品的常見工作之一。有些人用它來幫忙,省下自己刷社交媒體的時間;有些則是為了更密切地發現信息,以免熱點都涼了才看到。

這個實驗恰恰反映了,模型在勤勤懇懇抓取內容的時候,自身暴露在了退化的風險當中。而這一切,用戶都不會看到。

于是在不知不覺中,AI 被投喂了垃圾,生成了垃圾,你使用了垃圾,垃圾再進入互聯網,用于下一輪訓練,周而復始,陷入惡性循環。

這項研究最深刻的價值,在于它顛覆了我們對 AI 互動的傳統認知:以前我們總覺得 AI 像一個等待填滿的容器,輸入什么都能消化。但現在看來,它更像一個敏感的孩子,對輸入食物的質量非常挑剔。作為日常用戶,我們與 AI 的每一次對話,都是在進行一次「微調」。

既然知道「思考跳過」是主要的病灶,那么我們日常使用 AI 時,就必須主動要求它進行「反向操作」。

首先要做的,就是警惕那些「完美的答案」。不管是要求 AI 總結一個長文章,或者寫一份復雜的項目方案時,如果它只給出的結果,卻沒有顯示任何邏輯依據和推理過程(尤其是在支持思維鏈的情況下),就要多留個心眼。

相比于讓它反復調整結果,不如問一問它推理過程,「請列出你得出這個結論的全部步驟和分析依據」。強迫 AI 恢復推理鏈條,不僅能幫你驗證結果的可靠性,也是在防止它在這次任務中養成「偷懶」的壞習慣。

另外,對于那些基于社交媒體的工作任務,要格外小心?;旧弦?AI 當個實習生,它能力或許很強,但是不夠踏實靠譜,必須得有二次審核——實際上,我們的核查和糾正是極其寶貴的「高質量輸入」。不管是指出「這里的數據來源是錯的」,還是「你跳過了這個步驟」,都是在對模型進行一次有價值的微調,用高質量的反饋去抵抗互聯網中的垃圾信息。

這項研究比較讓人摸不著頭腦的地方在于:難道要讓 AI 少處理混亂的文件嗎?這豈不是本末倒置?

確實,如果為了避免 AI 可能出現的腦腐癥狀,而只讓它處理結構化程度更高的數據,那 AI 的價值就少了一半。我們使用 AI,恰恰在于處理那些混亂的、充滿重復句和情緒化表達的非結構化數據。

不過還是可以平衡一下,繼續讓 AI 執行信息整理工作,只不過在 AI 面對低質量輸入前,就給 AI 更清晰的指令。

比如,「總結這份聊天記錄」,容易讓 AI 悶頭只出結構。而更細化的「將這份聊天記錄進行分類處理,識別對話人物,去除口癖和連接詞,再提煉出客觀信息」,就在強行促使 AI 先思考一輪,整理出內部行動指南,再展開工作。

用戶不是不能用 AI 處理垃圾數據,畢竟這是它最能發揮的地方。只不過,為了降低 AI「腦腐」的風險,要用結構化的指令和高質量的反饋,將 AI 變成一個高效的「垃圾處理和凈化器」,而不是讓它被垃圾信息同化。

標簽: 垃圾 能力 推理 數據 過程 模型 社交

av大片免费观看-av大片免费看-国产精品国产三级国产普通话蜜臀-国产精品国产三级国产在线观看-久久福利小视频-久久福利一区-欧美日韩二区三区-欧美日韩福利-色婷婷成人网-色婷婷导航-亚洲男人天堂影院-亚洲男人网-2018年亚洲欧美在线v-亚洲香蕉aⅴ视频在线播放-少妇爆乳无码专区网站-亚洲aⅴ天堂av在线电影
  • <tfoot id="u2uyu"><delect id="u2uyu"></delect></tfoot><cite id="u2uyu"><center id="u2uyu"></center></cite>
  • <table id="u2uyu"></table><li id="u2uyu"><source id="u2uyu"></source></li>
    <abbr id="u2uyu"></abbr>
    <strike id="u2uyu"></strike>
    <strike id="u2uyu"><acronym id="u2uyu"></acronym></strike>
    <rt id="u2uyu"><tr id="u2uyu"></tr></rt>
    <button id="u2uyu"></button>
    <abbr id="u2uyu"></abbr>
  • <button id="u2uyu"></button>
    主站蜘蛛池模板: 欧美一级淫片丝袜脚交| 欧美日韩亚洲91| 国产精品一区二区三区成人| 久久久极品av| 亚洲第一网中文字幕| 91精品国产成人www| 久久视频中文字幕| 亚洲精美色品网站| 青青青国产精品一区二区| 日韩中文字幕网址| 亚洲自拍小视频| 欧美在线xxx| 欧美日韩免费一区| 国产一区二区三区在线观看视频 | 久久久国产在线视频| 亚洲国产成人久久| 国产成人啪精品视频免费网| 精品国产电影一区| 在线播放国产精品| 亚洲福利视频在线| 国产成人在线一区二区| 欧美激情视频一区二区| 少妇高潮 亚洲精品| 日韩电影免费观看在线| 国产精品视频xxxx| 91精品国产91久久久久福利| 美女黄色丝袜一区| 中国日韩欧美久久久久久久久| 亚洲一区二区三区视频播放| 日韩免费在线视频| 欧美极品xxxx| 久久99亚洲精品| 色婷婷综合成人| 亚洲人成在线播放| 亚洲国产天堂网精品网站| 国产精品视频一区二区高潮| 97精品视频在线观看| 欧美电影免费观看网站| 欧洲永久精品大片ww免费漫画| 激情久久av一区av二区av三区| 色琪琪综合男人的天堂aⅴ视频|