SWE-Lancer AI软件工程基准
SWE-Lancer是OpenAI推出的软件工程基准测试,包含1400多个真实世界的软件工程任务总价值100万美元。从50美元的Bug修复到32000美元的功能实现覆盖了真实自由职业中的各种任务类型。对评估AI模型的软件开发能力来说比纯算法题更接近实际工作情况。
AI Agent自动执行任务的平台。
FastApply-7B-v1.0 AI代码编辑模型
开源编码大语言模型,大规模强化学习优化,SWE-bench验证超越同类
AI智能体开发平台,整合插件记忆工作流等能力快速构建商业价值智能体
百川大模型 百川智能中文大模型
DeepCoder 开源代码推理模型