有消息称,meta正在开发比gpt4更强大的人工智能大模型llama3,开源且免费!

据人工智能新闻网站the decoder,这是openai工程师、前谷歌大脑工程师jason wei在meta组织的generative ai group社交活动中无意中听到的消息。


(资料图片仅供参考)

wei表示,他注意到meta现在有足够的计算能力来训练llama3和4。llama3计划达到gpt-4的性能水平,但仍将免费提供。

不过,目前还没有关于llama3何时发布甚至是否发布的官方声明。从今年2月发布的llama1到7月的llama2,meta花了大约五个月的时间。

但值得一提的是,gpt-4具有比llama标准版更复杂的架构。文章称,gpt-4可能通过使用更复杂的专家混合架构来实现其高性能,该架构具有16个专家网络,每个网络具有约1110亿个参数。

因此,从llama 2跳到llama 3可能不只是简单地进行扩展,并且可能比从llama 1跳到llama 2需要花费更长的时间。

llama2在某些应用中达到了gpt-3.5的水平,并且还通过微调和额外功能由开源社区进行优化。

例如,最近发布的基于llama2的codellama,通过微调在human eval编码基准测试中达到了gpt-3.5和gpt-4水平的结果(取决于测量类型)。

然而,在关于llama2的论文中,meta自己指出,与gpt-4和谷歌的palm-2等闭源模型之间仍存在巨大的性能差距。

所以可以说,llama2在某些方面达到了gpt-3.5的水平,但与最先进的闭源模型gpt-4相比,仍存在明显的差距。它主要的优势在于其开源性,即允许研究人员和开发者基于它进行调优和创新。

英国《金融时报》7月中旬报道称,meta开发llama模型的主要目标是,打破openai在大语言模型(llm)市场的主导地位。meta可能会尝试将llama模型建立为llm市场的一项支持技术,类似于谷歌在移动市场上对android所做的事情,以便稍后推出更多产品。此外,meta还从开源社区模型的快速开发中受益。

openai首席执行官sam altman于6月上旬表示,gpt-5距离训练发布还很远。谷歌计划在今年年底或明年初推出下一代多模态llm gemini。

风险提示及免责条款 市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

推荐内容

网站地图