树状分层反馈生成架构:实现大模型边思考边回答的探索

魏翔

PAPER · v1.0 · 2026-05-19 · human

Formal Sciences Computer Science Artificial intelligence and machine learning

Abstract

为促使大语言模型在生成过程中实时自我修正,实现真正的“边思考边回答”,本文提出一种树状分层反馈生成架构(Tree-structured Hierarchical Feedback Generation, THFG)。该架构通过树状分层生成、轻量满意度评估、反馈信号上推、渐进保守策略、随机激活自审、极细切分与相邻配对审阅六个核心模块,在尽量不提升计算开销的前提下实现多层树结构、点间反馈与模型预防性修正。实验基于Qwen2.5-14B模型进行微调验证,结果表明THFG在GSM8K、HellaSwag数学推理任务上取得显著提升。本文旨在为下一代大模型推理架构的设计提供一种可能的路径。作者本人属于跨界,本文验证相对单薄,主要是为各位同行提供一些思路

Keywords

大语言模型、思维链、树状推理、反馈机制、自我修正

Download PDF