AI模型下载

Llama 3.1 Nemotron Ultra 253B

Llama 3.1 Nemotron Ultra 253B NVIDIA大模型

标签:

Llama 3.1 Nemotron Ultra 253B是由NVIDIA基于Llama-3.1-405B-Instruct训练的大型语言模型,通过多阶段后训练来提升推理和聊天能力。支持128K上下文长度。对开发者和研究者来说这是一个在准确性和效率之间取得平衡的模型选择。可在NVIDIA的API上使用。

数据统计

相关导航