Deep Reinforcement Learning

评估大语言模型（LLMs）在可解释的深度强化学习（explainable deep ...

本文评估了CoT、MCTS增强和SFT三种方法在生成强化学习解释中的效果，发现MCTS显著提升大模型在复杂环境（如Lunar Lander）的解释质量，而SFT对中小模型更有效。通过LLMs作为评判者，验证了自动化评估框架与人工评估高度一致（Cohen's κ=0.77，Spearman ρ=0.88）。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

评估大语言模型（LLMs）在可解释的深度强化学习（explainable deep ...

今日热点