信陽專業(yè)網(wǎng)站建設(shè),wordpress怎么開放注冊,wordpress 采集偽原創(chuàng),玉環(huán)在哪里做網(wǎng)站簡介文章介紹上海交大與阿里通義聯(lián)合提出的ReMe框架#xff0c;通過多維度蒸餾、上下文自適應重用和基于效用的精煉三個機制重構(gòu)記憶生命周期。實驗表明ReMe刷新智能體記憶系統(tǒng)SOTA#xff0c;記憶擴展效應顯示配備ReMe的Qwen3-8B模型在Avg4和Pass4指標上超越無…簡介文章介紹上海交大與阿里通義聯(lián)合提出的ReMe框架通過多維度蒸餾、上下文自適應重用和基于效用的精煉三個機制重構(gòu)記憶生命周期。實驗表明ReMe刷新智能體記憶系統(tǒng)SOTA記憶擴展效應顯示配備ReMe的Qwen3-8B模型在Avg4和Pass4指標上超越無記憶的更大模型Qwen3-14B分別達8.83%與7.29%證明高質(zhì)量的自進化記憶可作為計算高效、替代模型規(guī)模增長的終身學習路徑。近年來大語言模型智能體正從靜態(tài)模型向具備自主推理與工具調(diào)用能力的動態(tài)系統(tǒng)演進而程序性記憶procedural memory作為內(nèi)化“如何做”知識的關(guān)鍵機制有望顯著減少冗余試錯、提升任務泛化能力。然而現(xiàn)有方法多采用“被動累積”范式將記憶視為靜態(tài)、僅追加的檔案庫難以支持動態(tài)推理與持續(xù)優(yōu)化。為彌合靜態(tài)存儲與動態(tài)認知之間的鴻溝**上海交通大學聯(lián)合阿里通義的研究者們提出 ReMeRemember Me, Refine Me——一個面向經(jīng)驗驅(qū)動的智能體進化框架通過多維度蒸餾、上下文自適應重用、基于效用的精煉三個核心機制重構(gòu)記憶生命周期。**在 BFCL-V3 與 AppWorld 基準上的大量實驗表明ReMe 顯著優(yōu)于現(xiàn)有方法刷新了智能體記憶系統(tǒng)SOTA。尤為關(guān)鍵的是實驗揭示了“記憶擴展效應”配備 ReMe 的 Qwen3-8B 模型在 Avg4 和 Pass4 指標上分別超越無記憶的更大模型 Qwen3-14B 達 8.83% 與 7.29%證明高質(zhì)量的自進化記憶可作為一種計算高效、替代模型規(guī)模增長的終身學習路徑。論文標題Remember Me, Refine Me: A Dynamic Procedural Memory Framework for Experience-Driven Agent Evolution論文鏈接https://arxiv.org/pdf/2512.10696項目鏈接https://github.com/agentscope-ai/ReMe一、方法圖2 ReMe框架圖如圖2所示ReMe 框架包含三個相互關(guān)聯(lián)的階段經(jīng)驗獲取、經(jīng)驗重用和經(jīng)驗精煉。在經(jīng)驗獲取階段總結(jié)模塊分析智能體生成的軌跡包括成功與失敗的軌跡并將其中可操作的知識提煉為結(jié)構(gòu)化的經(jīng)驗池。在經(jīng)驗重用階段面對新任務時檢索模塊從經(jīng)驗池中召回相關(guān)經(jīng)驗這些經(jīng)驗隨后被融入智能體的上下文以增強其推理能力和任務求解表現(xiàn)。最后在經(jīng)驗精煉階段系統(tǒng)持續(xù)優(yōu)化經(jīng)驗池通過納入新的可靠經(jīng)驗并剔除過時經(jīng)驗確保經(jīng)驗庫在長期使用中保持相關(guān)性并能適應不斷變化的任務需求。1經(jīng)驗獲取首先將智能體經(jīng)驗ε定義為代理執(zhí)行見解的結(jié)構(gòu)化、可泛化的表示。每個單獨的經(jīng)驗E ∈ε 表示為E ? ω, e, κ, c, τ ?,其中ω指明指明何時使用該經(jīng)驗e 表示核心經(jīng)驗內(nèi)容κ {κ1,κ2,…,κm}是用于分類的相關(guān)關(guān)鍵詞集合c∈[0,1]量化置信度分數(shù)τ 表示所使用的工具。ReMe 框架通過系統(tǒng)化流程構(gòu)建高質(zhì)量的初始經(jīng)驗池首先執(zhí)行智能體 LLMexecute 在多個訓練任務上采樣多條執(zhí)行軌跡以覆蓋多樣化的成功與失敗路徑隨后總結(jié)模型 LLMsumm對這些軌跡進行多維蒸餾包括識別成功策略、分析失敗原因以及對比成功與失敗的關(guān)鍵差異從而提煉出結(jié)構(gòu)化、可復用的經(jīng)驗接著通過 LLM-as-a-Judge 機制驗證經(jīng)驗的準確性、可操作性與價值并利用相似度去重去除冗余內(nèi)容確保經(jīng)驗池的緊湊性與多樣性最終所有有效經(jīng)驗以其使用場景的嵌入向量為索引存入向量數(shù)據(jù)庫。這一流程為后續(xù)高效檢索和策略性推理提供了堅實基礎(chǔ)。2經(jīng)驗重用在經(jīng)驗重用階段ReMe 通過檢索、重排序與重寫三步機制將歷史經(jīng)驗有效適配到當前任務首先利用高性能嵌入模型對任務查詢與經(jīng)驗池進行相似性匹配召回 top-K 最相關(guān)的經(jīng)驗其次可選地引入上下文感知的重排序模塊LLMrerank結(jié)合當前任務的具體約束和目標精細化評估經(jīng)驗的相關(guān)性最后通過重寫模塊將多條原始經(jīng)驗整合為一條連貫、聚焦且任務導向的指導文本提升其直接可用性。這一流程不僅增強了經(jīng)驗的即時效用還使智能體能夠在復用既有知識的同時保持靈活、上下文敏感的推理能力實現(xiàn)利用與探索的有機平衡。3經(jīng)驗精煉ReMe 框架通過經(jīng)驗精煉機制來實現(xiàn)經(jīng)驗池的動態(tài)優(yōu)化在添加新經(jīng)驗采用選擇性添加策略僅將成功完成任務的軌跡進行蒸餾提煉出結(jié)構(gòu)化、可復用的經(jīng)驗并存入經(jīng)驗池。盡管在初始構(gòu)建階段可通過多條失敗軌跡的聯(lián)合分析提取有價值的信息但在實時任務執(zhí)行中單次失敗軌跡往往缺乏足夠的上下文支持準確歸因容易生成誤導性經(jīng)驗。此外采用失敗感知反思機制當任務失敗時由 LLMsumm 分析失敗原因并生成改進建議LLMexecute 基于建議重新嘗試僅在新嘗試成功時將所得洞見存入記憶并限制最多進行 3 輪自我反思以防陷入無效循環(huán)。ReMe持續(xù)記錄現(xiàn)有體驗的狀態(tài)包括總調(diào)用次數(shù)f和歷史效用u每次其調(diào)用有助于成功完成任務時效用就會增加1。當經(jīng)驗 E ∈ ε 頻繁被調(diào)用但未能提高新任務性能時它將被刪除通過整合上述組件ReMe 構(gòu)建了一個能夠自我進化的經(jīng)驗池既能保留高質(zhì)量的經(jīng)驗以塑造智能體的長期行為又能靈活適應新的任務需求。二、評估表1 ReMe與基線模型在BFCL?V3、AppWorld基準測試上的性能比較表1展示了ReMe在Qwen3系列模型上于BFCL-V3和AppWorld基準測試中的主要結(jié)果?？傮w而言**ReMe在三種不同模型規(guī)模下均取得了最高的平均任務成功率始終優(yōu)于無記憶基線方法以及其他具有競爭力的基線記憶系統(tǒng)。**具體而言在Qwen3-8B模型上ReMe相較于無記憶基線方法在Pass4指標上平均提升了7.29%在Avg4指標上平均提升了8.83%。Pass4指標的提升表明檢索到的經(jīng)驗能夠有效拓寬探索空間從而提高在多次嘗試中至少找到一個成功解決方案的概率。**ReMe 動態(tài)版本在所有模型規(guī)模和基準測試中始終優(yōu)于其靜態(tài)版本凸顯了在任務執(zhí)行過程中進行自適應經(jīng)驗精煉的重要性。此外與基線方法相比ReMe動態(tài)性能有突出的穩(wěn)定性。**例如LangMem在BFCL-V3上表現(xiàn)良好但在AppWorld上的性能顯著下降。相比之下ReMe在BFCL-V3和AppWorld兩個基準測試中均展現(xiàn)出卓越的一致性。ReMe 傾向于降低多次運行之間性能的標準差尤其是在較大模型上更為明顯。這表明 ReMe 不僅提升了整體性能還增強了模型輸出的魯棒性與可靠性。值得注意的是配備ReMe的小模型可以與甚至超越無記憶的大模型。例如Qwen3?8BReMe動態(tài)的平均Pass4分數(shù)超過了樸素Qwen3?14B模型。類似地Qwen3?14BReMe動態(tài)超過了無記憶Qwen3?32B的整體性能。這表明有效的記憶機制可以顯著縮小不同模型規(guī)模之間的性能差距。圖5 使用與未使用 ReMe 時失敗任務的統(tǒng)計情況研究者對 Qwen3-8B 模型在 BFCL-V3 基準上使用與未使用 ReMe 時的錯誤模式進行了分析。圖5a所示失敗案例總數(shù)從 62 個減少到 47 個。ReMe 修正了 17 個基線獨有的錯誤僅引入了 2 個新錯誤。此外進行人工審查并對每類失敗案例進行歸類以考察 ReMe 對不同錯誤類型的影響如圖5b所示。推理錯誤顯著減少從 22 降至 14表明ReMe能有效利用過往經(jīng)驗增強其多步推理能力從而減少早期錯誤的傳播。動作遺漏錯誤也出現(xiàn)了中等但具有實際意義的下降這有助于智能體識別多輪任務中缺失的操作步驟尤其是在需要順序工具調(diào)用或狀態(tài)追蹤的任務中。三、如何學習AI大模型如果你對AI大模型入門感興趣那么你需要的話可以點擊這里大模型重磅福利入門進階全套104G學習資源包免費分享這份完整版的大模型 AI 學習和面試資料已經(jīng)上傳CSDN朋友們?nèi)绻枰梢晕⑿艗呙柘路紺SDN官方認證二維碼免費領(lǐng)取【保證100%免費】這是一份大模型從零基礎(chǔ)到進階的學習路線大綱全覽小伙伴們記得點個收藏第一階段從大模型系統(tǒng)設(shè)計入手講解大模型的主要方法第二階段在通過大模型提示詞工程從Prompts角度入手更好發(fā)揮模型的作用第三階段大模型平臺應用開發(fā)借助阿里云PAI平臺構(gòu)建電商領(lǐng)域虛擬試衣系統(tǒng)第四階段大模型知識庫應用開發(fā)以LangChain框架為例構(gòu)建物流行業(yè)咨詢智能問答系統(tǒng)第五階段大模型微調(diào)開發(fā)借助以大健康、新零售、新媒體領(lǐng)域構(gòu)建適合當前領(lǐng)域大模型第六階段以SD多模態(tài)大模型為主搭建了文生圖小程序案例第七階段以大模型平臺應用與開發(fā)為主通過星火大模型文心大模型等成熟大模型構(gòu)建大模型行業(yè)應用。100套AI大模型商業(yè)化落地方案大模型全套視頻教程200本大模型PDF書籍學會后的收獲? 基于大模型全棧工程實現(xiàn)前端、后端、產(chǎn)品經(jīng)理、設(shè)計、數(shù)據(jù)分析等通過這門課可獲得不同能力? 能夠利用大模型解決相關(guān)實際項目需求大數(shù)據(jù)時代越來越多的企業(yè)和機構(gòu)需要處理海量數(shù)據(jù)利用大模型技術(shù)可以更好地處理這些數(shù)據(jù)提高數(shù)據(jù)分析和決策的準確性。因此掌握大模型應用開發(fā)技能可以讓程序員更好地應對實際項目需求? 基于大模型和企業(yè)數(shù)據(jù)AI應用開發(fā)實現(xiàn)大模型理論、掌握GPU算力、硬件、LangChain開發(fā)框架和項目實戰(zhàn)技能學會Fine-tuning垂直訓練大模型數(shù)據(jù)準備、數(shù)據(jù)蒸餾、大模型部署一站式掌握? 能夠完成時下熱門大模型垂直領(lǐng)域模型訓練能力提高程序員的編碼能力大模型應用開發(fā)需要掌握機器學習算法、深度學習框架等技術(shù)這些技術(shù)的掌握可以提高程序員的編碼能力和分析能力讓程序員更加熟練地編寫高質(zhì)量的代碼。LLM面試題合集大模型產(chǎn)品經(jīng)理資源合集大模型項目實戰(zhàn)合集獲取方式有需要的小伙伴可以保存圖片到wx掃描二v碼免費領(lǐng)取【保證100%免費】

国产中文字幕在线视频,.com久久久,亚洲免费在线播放视频,神九影院电视剧免费观看,奇米在线888,天天网综合,久久免费视频观看

信陽專業(yè)網(wǎng)站建設(shè)wordpress怎么開放注冊

泛解析對網(wǎng)站的影響蘇州免費網(wǎng)頁制作模板

做網(wǎng)站和網(wǎng)站頁面設(shè)計蘇州網(wǎng)頁設(shè)計師培訓

鄭州網(wǎng)站專業(yè)建設(shè)qq唐山做網(wǎng)站的公司

東莞企業(yè)網(wǎng)站建設(shè)營銷大數(shù)據(jù)精準營銷獲客

網(wǎng)站的建設(shè)與管理的心得體會浙江網(wǎng)站建設(shè)優(yōu)化

品牌型網(wǎng)站建設(shè)做網(wǎng)站前需要準備什么條件

国产中文字幕在线视频,.com久久久,亚洲免费在线播放视频,神九影院电视剧免费观看,奇米在线888,天天网综合,久久免费视频观看

信陽專業(yè)網(wǎng)站建設(shè)wordpress怎么開放注冊

泛解析對網(wǎng)站的影響蘇州免費網(wǎng)頁制作模板

做網(wǎng)站和網(wǎng)站頁面設(shè)計蘇州網(wǎng)頁設(shè)計師培訓

鄭州網(wǎng)站專業(yè)建設(shè)qq唐山做網(wǎng)站的公司

東莞企業(yè)網(wǎng)站建設(shè)營銷大數(shù)據(jù)精準營銷獲客

網(wǎng)站的建設(shè)與管理的心得體會浙江網(wǎng)站建設(shè)優(yōu)化

品牌型 網(wǎng)站建設(shè)做網(wǎng)站前需要準備什么條件

品牌型網(wǎng)站建設(shè)做網(wǎng)站前需要準備什么條件