微软(MSFT.US)周二表示,其人工智能模型Phi-2的性能好于Meta(MTEA.US)等其他公司的竞争产品,并且能够在设备上运行。
微软在一篇博客中表示:“Phi-2模型仅有27亿个参数,但在各种综合基准测试中,它的表现超过了欧洲AI初创公司Mistral旗下拥有70亿个参数的大语言模型(LLM)Mistral 7B、以及Meta发布的参数达130亿个的AI模型Llama 2。”“值得注意的是,Phi-2模型在多步推理任务(即编码和数学)上的表现优于参数达700亿的Llama 2(Llama 2模型系列包含70亿、130亿和700亿三种参数变体)。”
微软补充称:“此外,Phi-2模型的性能与最近发布的谷歌Gemini Nano 2相当、甚至更好,尽管模型规模较小。”微软表示,Phi-2模型将在Azure Studio中推出。
据悉,微软于今年6月发布只有13 亿参数的Phi-1模型,适用于QA问答、聊天格式和代码等等场景。该模型完全基于高质量数据进行训练,在基准测试中的表现比同类模型高出10倍。
微软今年9 月更新发布了Phi-1.5版本,同样为13亿参数,可以写诗、写电子邮件和故事,以及总结文本。在常识、语言理解和推理的基准测试中,该模型在某些领域能够跟上多达100亿个参数的模型。
微软在11月更新发布的Phi-2规模虽然比此前版本翻番,但相比较其它主流语言模型依然小很多。微软表示,Phi-2在逻辑推理和安全性方面显示出显著的改进,通过正确的微调和定制,小型语言模型是云和边缘应用程序的强大工具。