瑞士发布自主开源AI大模型Apertus支持千余种语言
在人工智能技术于全球蓬勃发展的背景下,瑞士于近日正式发布了其首个完全开源的大语言模型——Apertus。该模型由瑞士洛桑联邦理工学院(EPFL)、苏黎世联邦理工学院(ETH Zurich)和国家超级计算中心(CSCS)联合开发,标志着瑞士在人工智能领域的自主创新方面迈出了重要一步。
Apertus作为瑞士国家级的大语言模型,具备多语言处理能力,覆盖超过1000种语言,其中40%的数据来自非英语语言。这一特性不仅增强了多样性的包容性,也使Apertus能够更好地服务于瑞士境内的特殊语言需求,例如瑞士德语和罗曼什语。这种开放设计旨在为用户提供一种替代OpenAI等国际公司的AI解决方案。
值得注意的是,Apertus的开发过程充分体现了透明和开放的原则。除了模型权重外,研究团队还公开了模型架构、训练数据和训练过程,并采用了宽松的开源许可证,支持教育、研究和商业用途。这一举措大大降低了用户的使用门槛,使更多的研究人员和开发人员能够参与到人工智能的创新中来。
Apertus在瑞士的“Alps”超级计算机上进行训练,该计算机配备了超过10000个英伟达(NVIDIA)Grace Hopper GPU,并使用可再生能源,体现了对可持续发展的承诺。据研究团队介绍,Apertus提供两个版本:一个拥有80亿参数,适用于个人用户和轻量级应用;另一个拥有700亿参数,专为复杂场景设计。
目前,用户可以通过Swisscom平台、Hugging Face和Public AI Network等渠道访问Apertus。瑞士政府希望通过该项目将人工智能建设成为一种公共基础设施,强调合规性、透明性和包容性价值,以增强研究、教育和行业的创新能力。
背景补充:Hugging Face是一个流行的AI模型和数据集共享平台,被广泛用于机器学习模型的开发和部署。NVIDIA Grace Hopper是英伟达推出的一款面向高性能计算和AI的加速器。

 
                         
                         
                         
                         
                        