新浪新闻是什么级别的媒体

娱乐新闻 496
  【导读】微软紧跟OpenAI的节奏,在同一天也亲自下场发布了微软自研的两个大模型:语音模型MAI-Voice-1和通用模型MAI-1-preview。对于这位老大哥,亲自下场做的第一个AI大模型,效果究竟怎么样?   MAI-Voice-1语音模型效率极高:单GPU秒出1分钟音频!使用Copilot即可体验。   这标志着在多年依赖OpenAI模型之后,微软AI部门正式与OpenAI及整个行业正面竞争,也意味着微软在AI竞赛中,开始掌握更多主动权。

  【导读】微软紧跟OpenAI的节奏,在同一天也亲自下场发布了微软自研的两个大模型:语音模型MAI-Voice-1和通用模型MAI-1-preview。对于这位老大哥,亲自下场做的第一个AI大模型,效果究竟怎么样?

  MAI-Voice-1语音模型效率极高:单GPU秒出1分钟音频!使用Copilot即可体验。

  这标志着在多年依赖OpenAI模型之后,微软AI部门正式与OpenAI及整个行业正面竞争,也意味着微软在AI竞赛中,开始掌握更多主动权。

  在接受采访时,Suleyman 表示:「微软是世界上最大的公司之一。我们必须具备内部能力,来打造世界最强的模型。」

  除此之外,语音的自然和富有表现力也是重点,这覆盖到了单人叙述与多说话人对话两种常见内容形态。

  下面是两段该模型生成的语音Demo,你可以听听看,满分5分想给几分?是否还有AI味呢?欢迎在评论区留下您的测评意见。

  OpenAI目前估值约5000亿美元,微软一家的投资就超过了130亿美元,而OpenAI也依赖微软的云基础设施来运行其模型。

  但现在宣布:「未来几周,我们将在Copilot的部分文本任务中逐步推出MAI-1-preview,以便从用户反馈中学习和改进。」

  去年,微软在年度财报中正式将OpenAI列入竞争对手名单,之前多年来只包含亚马逊、苹果、谷歌和 Meta等科技巨头。

  近几个月,OpenAI也转向CoreWeave、谷歌和甲骨文等其他云服务商,以满足激增的算力需求。

  该模型在语音自然性、情感丰富度、低延迟响应上显著提升,能够在一句话之内实现语调、语言的无缝切换,还支持工具调用、指令跟随能力。

  微软此举既是对OpenAI合作的补充,也为自己与OpenAI的重大商业谈判中增加了可观的筹码。

  MAI‑1‑preview采用MoE架构,训练规模适中但更关注指令遵循和响应效率,能兼顾性能与成本。

  Suleyman强调,微软未来会继续使用OpenAI的模型,也会用开源模型,但关键在于「编排器」(orchestrator)。

  Suleyman认为自研的新模型表现远超其硬件规模,完全可以和世界上最强的模型媲美,而且现在才刚刚开始调优。

  微软AI算力充沛,已经在使用全球最大的数据中心之一,并配备了Nvidia下一代GB-200芯片,研发下一版本模型。

  现在训练模型的核心能力,已经越来越变成了一种「工艺」——选对数据,避免把算力浪费在无效的token上。

  Suleyman坦言:「构建这样规模的集群、训练如此庞大的数据,需要不断的调试、迭代和耐心。这是每一家实验室都会面临的难题。」

  之前,Suleyman在Inflection,甚至DeepMind都有相关经验,不过那时候算力规模较小,GPU还没有动辄十万张。

扫码二维码