近日,OB電競數碼旗下OB電競問學的研究團隊在預印本平臺 Arxiv 發布論文《Routine: A Structural Planning Framework for LLM-Agent System in Enterprise》,提出一種名為“Routine”的結構化規劃框架,旨在解決大模型智能體(LLM-Agent)在企業專業場景應用中面臨的三大核心挑戰:場景知識缺乏導致流程編排錯誤、規劃格式不統一引發執行不穩定,以及低代碼方法非AI原生導致的用戶不友好問題。

論文作者:曾冠程、陳雪怡、胡嘉旺、齊少華、毛雅瑄、王展韜、聶一凡、李爽、馮秋陽、邱鵬旭、王鈺佳、韓文強、黃琳琰、李剛、莫晶晶、胡浩文(通訊)
企業中智能體系統的痛點
論文指出,當前企業級智能體系統在實際部署中存在顯著瓶頸:
1. 知識鴻溝與工具編排混亂: 通用模型缺乏企業特定場景知識,難以正確編排工具鏈,常忽略關鍵工具類型。
2. 規劃非標準化導致執行偏差: 模型依賴泛化理解遵循非標準規劃,導致規劃到執行的轉化過程不穩定。
3. 低代碼方案的局限性: 傳統低代碼方式對非技術人員門檻高,且構建的工作流難以跨場景復用,非AI原生方法效率低下。
為解決這些問題,OB電競數碼團隊
創新性地提出了“Routine”規劃范式
Routine由多個更小、更具體的子任務執行步驟組成,子任務是獨立的,但之間又相互關聯。因此,一條Routine執行步驟需要包括足夠信息,讓智能體能夠穩定地遵循規劃步驟,以下是一條完整的Routine子任務步驟組成:
步驟x. <步驟名稱>:<步驟行為描述>,該步驟輸入<入參描述>,輸出<出參描述>,使用<步驟工具>工具;
類似場景下的Routine可能包含重疊的步驟,僅在某些流程段上有所不同,類似于同一工作流的不同分支。在這種情況下,可以通過創建分支步驟和執行條件來合并類似的場景,以在一個Routine中設置多個相似的工作流。
步驟x. <步驟名稱>: 本步驟進行分支條件判斷:
分支x-1步驟1. <步驟名稱>:如果<步驟條件>,......,使用<步驟工具>工具;
分支x-1步驟2. <步驟名稱>:......,使用<步驟工具>工具;
分支x-2步驟1. <步驟名稱>:如果<步驟條件>,......,使用<步驟工具>工具;
步驟y. <步驟名稱>:......,使用<步驟工具>工具;
步驟z. <步驟名稱>:......,使用<步驟工具>工具,并結束工作流;
Routine格式作為大語言模型生成規劃與實際執行引擎之間的中間表示層,將每一步工具調用以標準化格式明確表達,涵蓋工具名稱、參數、依賴關系與執行狀態等關鍵字段,能夠有效提升執行模型遵循規劃的準確性,指導智能體完成多樣化的場景任務。

Routine智能體系統的核心架構
以Routine機制為核心,研究團隊優化了智能體系統的設計,包含四大關鍵模塊的優化:
1. 規劃模塊:
? 標準化格式: Routine由明確的子任務步驟組成,包含步驟編號、名稱、行為描述、輸入/輸出參數描述和調用的工具名稱,并且支持分支流程表示。
? AI生成與優化: 業務專家提供流程草稿,模型利用專用提示模板進行優化,輸出結構化的自然語言Routine。消融實驗證明,AI優化的Routine能顯著提升執行準確率,接近甚至部分超越人工標注基準。
2. 執行模塊:
? 小參數模型:采用小參數模型,通過指令微調與強化學習等方法訓練,設置對應的多步工具調用獎勵函數,指導模型適配到場景,增強模型指令遵循能力。
? 上下文工程機制:研究團隊明確了智能體系統解決任務所需要的信息和配置,并構建了對應的上下文模板,其中不僅包含角色定義、任務背景與行為規范等常規內容,還包含了系統參數、解決問題對應的Routine規劃、變量記憶字典、工具列表等關鍵信息;
3. 工具模塊:
? MCP服務器:使用MCP服務器作為標準化工具層,對工具的名稱、參數、返回格式進行統一定義和管理。
4. 記憶模塊:
? 流程記憶:存儲專家創建或AI優化的場景Routine集合,根據用戶任務相似度動態檢索召回最相關的Routine,避免將所有Routine塞入上下文。
? 變量記憶: 將長文本參數等存儲為變量鍵,執行時自動替換為實際值,極大減輕模型上下文壓力,減少參數傳遞中的符號錯誤。
幾個模塊相互協作,形成了功能完善的智能體系統,如圖中所示:

文章中總結了以下工作
1. 結構化規劃范式: 設計了一套結構化的標準規劃格式“Routine”,顯著提升智能體通過多步工具調用解決復雜問題的穩定性。在實際企業場景中的驗證表明,Routine顯著提升了模型工具調用的執行準確性,將GPT-4o的性能從41.1%提高到96.3%,將Qwen3-14B的性能從32.6%提升到83.3%。
2. Routine遵循能力訓練: 為進一步驗證Routine框架的有效性,研究團隊構建了一個Routine格式的指令遵循訓練數據集,通過指令微調和強化學習,使其場景特定評估的準確性增至88.2%,表明該框架顯著改善了模型在執行計劃方面的遵循性。
3. 基于Routine的數據蒸餾:通過知識蒸餾方法生成了一個場景特定的多步驟工具調用數據集,在此蒸餾數據集上進行微調使模型準確性提高到95.5%,接近GPT-4o的水平。這些結果充分展示了Routine框架在領域特定工具使用模式優化和增強模型適應新場景能力方面的有效性。
后續應用
以AI for Process為核心方向,Routine框架的引入顯著提高了代理系統在企業場景中的適應性。它不僅優化了領域特定工具使用模式,還增強了模型應對復雜任務的能力,為企業流程的智能化和自動化提供了穩健可靠的解決方案。未來,通過在訓練流程中引入強化學習,能更好地提升模型對多樣化場景的流程泛化能力。通過持續的研究和優化,Routine框架有望在未來進一步提高智能體的自主性和適應性,推進企業智能體在企業環境中的廣泛應用。
OB電競問學將持續深耕場景化知識引擎與智能體協同技術,致力于構建具備更強流程認知與自適應進化能力的企業級智能體,打通從復雜業務邏輯到敏捷AI落地的關鍵路徑,為企業智能化轉型提供堅實、靈活且可規模化的技術支撐。
版權所有2016-2025 OB電競數碼集團股份有限公司,保留一切權利。 京ICP備84870731號-1
京公網安備 11010802037792號