AI开发编程

PokéLLMon

LLM 代理在宝可梦对战中实现人类级表现,融合强化学习与知识增强。

标签:

PokéLLMon 是首个在宝可梦战术对战中达到人类水平的 LLM 代理。它融合了三种关键策略:基于实战文本反馈的即时强化学习、外部知识增强避免幻觉、以及自一致性动作生成减少失误。在线上排位赛中达到 49% 胜率,邀请赛 56%。对于研究者和游戏 AI 爱好者来说,这是一个了解 LLM 在复杂策略游戏中应用的前沿案例。

访问官网 →

数据统计

相关导航