中文字幕av影院,欧美一级欧美三级在线观看,av三级写真有码在线看,日本精品aaa,992tv成人国产福利在线观看,久久久久久久久浪潮精品,91精品久久久久久久久不口人,激情欧美在线
  • 丑態百出網

    今天(10日),我們迎來第41個教師節教育是強國建設、民族復

    AI解數學題只靠最后一個token

    henry 發自 凹非寺量子位 | 公眾號 QbitAI

    大語言模型在解心算題時,只依賴最后一個token?

    最近,來自加州大學圣克魯茲分校、喬治·梅森大學和Datadog的研究人員發現:在心算任務中,幾乎所有實際的數學計算都集中在序列的最后一個token上完成,而不是分散在所有token中。

    這意味著,相較于在Transformer和多層感知機(MLP)中常見的全局信息訪問——即每個token在預測時都能查詢并利用整個上文信息——在諸如心算這樣的特定任務中,全局訪問其實并不是必需的。

    這是怎么一回事?

    心算只要最后一個token?!

    總的來說,研究人員采用了上下文感知平均消融(Context-Aware Mean Ablation, CAMA)基于注意力的窺視(attention-based peeking)技術對Llama-3-8B等Transformer架構的模型進行了一系列的消融實驗。

    這些實驗通過系統性地移除或改變模型的一部分,探究能讓模型依然表現良好的“最少計算量”

    在這一過程中,研究人員發現模型內部會形成一個稀疏子圖(sparse subgraph)——他們把它稱為“人人為我”(All-for-One, AF1)。

    這個子圖通過最少的計算層和最有限的信息傳遞,讓模型高效完成運算。

    在“人人為我”中,輸入Transformer前幾層(L_wait)的token并沒有做跟“自己數值”相關的計算,而是“等待”,并主要承擔一些通用的準備工作(比如識別token、結構編碼、預測下一步所需的通用表示)。

    然后,在中間的兩層(L_transfer)里,它們就將信息傳遞給最后一個token。

    之后,最后一個token獨自完成計算并給出答案。

    這一過程表明,模型內部將任務通用型計算(如 token 識別、數值與結構編碼)與輸入特定型計算(如實際算術運算)是分開的。

    (注:這篇研究聚焦于心算任務,即涉及兩個或三個操作數的算術問題(例如42+20?15),這些問題可以通過單個token的輸出解決,而無需模型進行顯式的鏈式思維推理。)

    接下來,我們具體來看。

    眾所周知,大語言模型在許多計算任務上表現出色,而其中一個重要原因是其采用了Transformer架構。

    與RNN不同,Transformer允許任意token通過自注意力機制立即訪問所有先前的token以傳遞信息,并使每個token能夠通過多層感知機(MLP)并行執行各自的獨立計算。

    但即便如此,模型內部的信息流和計算過程仍然是不透明的。

    因此,為了揭開大語言模型的“黑箱”,研究人員采用了以下三個步驟來進行探索。

    首先,在模型的初始層抑制token針對特定輸入的計算

    研究人員發現,在傳統Transformer的每一層中,token都能訪問所有之前的token,但對于簡單的心算任務,每個token可能未必從一開始就要獲得全局信息。

    由此,研究人員引入了等待期(L_wait):讓在前面的L_wait層中的token獨立計算,只執行任務通用操作(如理解數字、識別算術結構),而不訪問其他token。

    為了實現這一點,他們使用了上下文感知平均消融(CAMA)

    CAMA的作用是屏蔽掉token之間的輸入特定信息,同時保留每個token的普遍計算能力,使模型能夠在不依賴具體輸入的情況下完成基礎準備工作。

    接下來,在少數幾層中限制跨token位置的信息傳遞路徑。只讓最后token在L_transfer層中訪問所有token,其余層只關注自己。

    最后,在剩余的層中強制所有計算都在最后一個token上發生

    由于CAMA只能從第一層開始,因此,研究人員引入了一種可以在任意層控制信息訪問的方法——基于注意力的窺視(ABP)

    它通過修改注意力掩碼(attention mask),精確指定每個“查詢”(query)token可以關注哪些“鍵”(key)。

    在這篇論文中,研究人員主要使用了以下兩種模式:

    完全窺探 (Full-peeking):token可以關注所有在它之前的token,這是標準的因果注意力。在AF1的傳遞階段,最后一個token使用此模式來收集信息。自我窺探 (Self-peeking):token只能關注它自己,在傳遞和計算階段,所有非末尾的token都使用此模式;在計算階段,最后一個token也切換到此模式。

    實驗驗證

    在完成方法和操作流程的構建后,研究者進行了一系列實驗來發現、驗證和分析AF1子圖。這里主要涉及到Llama-3-8B和Llama-3.1-8B,以及在Pythia和GPT-J模型上的驗證。

    首先,通過三階段消融與窺視實驗,研究人員發現Llama-3-8B在A+B+C任務中只需前14層做任務通用計算(CAMA 層),然后通過2層信息傳輸讓最后的token獲取全局信息,剩余層僅進行最后token的自計算。

    這個幾乎保留全部性能的子圖被命名為AF1_llama

    接下來,研究人員又進一步驗證了AF1_llama在Llama-3-8B和Llama-3.1-8B上的表現。

    實驗表明,AF1_llama在八個任務中總體表現出高忠實度。

    更進一步,實驗進一步驗證了第15和16層的信息傳輸在Llama-3-8B中的重要性。

    研究表明,僅少數注意力頭對算術計算關鍵,即使移除近60個頭部,模型仍能保持約95%的準確率,表明大部分注意力頭冗余,而關鍵頭集中在少數層。

    此外,為了探究AF1_llama是否可以在Llama-3-8B上泛化到表示A+B和A?B運算的其他算術形式,研究進一步將口頭描述運算以及將運算嵌入到應用題或Python代碼中。

    實驗表明,AF1_llama在不包含額外語義上下文的直接算術任務中仍保持了相當高的準確率。

    然而,它在需要語義理解的任務上,如應用題和Python代碼,完全失敗了,這表明它需要額外的組件來處理其他能力,比如理解自然語言或Python程序輸入。

    最后,研究人員在Pythia和GPT-J中也發現了類似AF1的子圖,但與Llama不同,這些模型的等待期更短(L_wait ≈ 9–11)、信息傳輸層更長,且性能邊界不如Llama清晰。

    盡管忠實度普遍低于Llama,但對二元運算任務的子圖仍能恢復超過一半的原始模型準確率。

    總體而言,這項工作為大語言模型中的算術推理和跨token計算的機制理解做出了貢獻。此外,它通過CAMA和ABP提供了方法論上的創新,可服務于算術任務之外的更廣泛應用。

    [1]https://x.com/rohanpaul_ai/status/1966788202238448101

    [2]https://www.arxiv.org/pdf/2509.09650

    訪客,請您發表評論:

    網站分類
    熱門文章
    友情鏈接
    主站蜘蛛池模板: 欧美日韩国产一二| 亚洲美女在线一区| 国产欧美三区| 99国产午夜精品一区二区天美| 香蕉av一区二区| 亚洲一区中文字幕| 久久精品一| 国产三级欧美三级日产三级99| xxxx18hd护士hd护士| 日本一区午夜艳熟免费| 日韩欧美国产中文字幕| 夜夜嗨av禁果av粉嫩av懂色av | 国产91精品高清一区二区三区| 欧美日韩国产精品综合| 少妇**毛片| 国产精品爽到爆呻吟高潮不挺| 中文字幕在线播放一区| 欧美精品xxxxx| 精品国产乱码久久久久久老虎| 色噜噜日韩精品欧美一区二区| 日本一区二区高清| 国产suv精品一区二区4| 91人人精品| 日本一区二区三区电影免费观看| 国产特级淫片免费看| 丰满少妇在线播放bd日韩电影| 999久久国精品免费观看网站| 国产一区亚洲一区| 久久夜靖品2区| 国产女人好紧好爽| 午夜无遮挡| 欧美一区二区三区免费观看视频 | 久久伊人色综合| 欧美在线视频一区二区三区| 日韩精品免费一区| 国产91高清| 玖玖爱国产精品| 久久99精品久久久噜噜最新章节| 久久久久亚洲精品视频| 国产一区二区免费在线| 日本激情视频一区二区三区| 国产一二区在线| 一区二区三区四区国产| 91看片淫黄大片91| 日韩精品中文字| 93久久精品日日躁夜夜躁欧美| 国产乱人伦精品一区二区三区| 中文字幕日本精品一区二区三区| 久久精品亚洲精品| 免费毛片a| 久久综合久久自在自线精品自| 一区二区三区日韩精品| 午夜伦理片在线观看| 日本aⅴ精品一区二区三区日| 97午夜视频| www.午夜av| 日韩av在线播| 欧美亚洲精品一区二区三区| 国产麻豆一区二区| 久久久精品二区| 国产婷婷色一区二区三区在线| 欧美在线视频二区| 一区二区三区国产精品| 久久精品视频中文字幕| 自拍偷在线精品自拍偷无码专区| 国产一区二区三级| 久久九精品| 国产欧美亚洲一区二区| 免费a级毛片18以上观看精品| 免费看性生活片| 国久久久久久| 中文字幕一区二区三区不卡| 久久国产激情视频| 精品国产一区二区三区国产馆杂枝| 99国产精品永久免费视频 | 午夜剧场a级片| 国产精品久久久久久久久久久新郎 | 日韩欧美高清一区| 欧美一区久久| 伊人久久婷婷色综合98网| 午夜一二区| 久久久综合亚洲91久久98|