OpenAI多模态模型,支持文本、图像、音频处理。
GPT-4o 是 OpenAI 的多模态模型,o 代表 omni(全能)。和 GPT-4 比,GPT-4o 的突破是原生多模态——它能同时理解文本、图像、音频,不再需要分开调用不同模型。响应速度是 GPT-4 的 2 倍,成本降低了一半。在视觉理解、语音对话场景上表现尤为出色。通过 ChatGPT Plus 或 API 使用。
访问官网 →
出门问问AI大模型平台。
北京智源研究院开源大模型。
首个端到端AI生成3D游戏的多模态大模型,自然语言描述即可构建游戏
EasyDL 百度零代码AI模型训练
AI创意生成模型平台。
AI智能体开发平台,整合插件记忆工作流等能力快速构建商业价值智能体