Google最新最强模型,1M上下文窗口,支持音频图像视频文本PDF多模态输入
Gemini 3 Pro Preview 是 Google 当前最强的模型预览版。最大的亮点是 100 万 token 的上下文窗口——能一次处理整个代码库分析长度如一本书的文档。支持音频、图像、视频、文本和 PDF 的多模态输入。在长上下文理解任务上表现优异。适合需要处理超长文档或大型代码库的开发者。
360智脑 360安全大模型
离线AI模型运行桌面客户端。
DeepSpeed,微软开发的开源深度学习优化库,大规模模型分布式训练的工具
Segment Anything Meta图像分割模型
OpenPose模型 人体姿态估计
Llama 3.1 Nemotron Ultra 253B NVIDIA大模型