国内首例复刻ChatGPT研发模式,360携手智谱AI战略合作大语言模型
双方共同研发的千亿级大模型“360GLM”,已具备新一代认知智能通用模型水准
《投资时报》记者 安喆
5月16日,三六零(601360.SH,下称“360”)和智谱AI宣布达成战略合作,双方共同研发的千亿级大模型“360GLM”已具备新一代认知智能通用模型水准。
《投资时报》记者了解到,双方合作研发,是基础模型和应用场景的一次有效结合。360集团创始人周鸿祎曾多次表示,微软作为产业公司补齐了OpenAI的工程化、场景化、产品化和商业化能力,是微软和OpenAI珠联璧合的分工模式促成了这次人工智能拐点的涌现。国内应当建立大型科技企业+重点科研机构的产研协同创新模式,打造中国的“微软+OpenAI”组合引领大模型技术攻关。他表示,此次与智谱AI合作,正是借鉴了这种产研协同关系。
图为360大模型战略布局。
据介绍,智谱AI是国内顶级人工智能科技公司,被评价为国内“最具OpenAI气质和水准”的AI公司。去年11月,斯坦福大学大模型中心对全球30个主流大模型进行全方位评测,智谱AI研发的双语千亿级超大规模预训练模型GLM-130B 是亚洲唯一入选的大模型,测评结果显示,其准确性等关键指标与OpenAI、谷歌大脑、微软和英伟达等公司的大模型接近或持平,全球已有70个国家1000余家机构申请使用。
团队研发的ChatGLM在GLM-130B 上通过有监督微调等技术实现人类意图对齐;支持英伟达和华为昇腾、海光及申威等国产芯片进行训练和推理,开源的 ChatGLM-6B 模型全球下载超过160万,持续两周位列 Huggingface 全球模型趋势榜榜首。
对于此次合作,智谱AI CEO张鹏表示,智谱AI一直坚持着自己的愿景:让机器像人一样思考,实现Model as a Service(MaaS)的理念。360拥有国内先进的多模态研发团队,在AI技术上有长期积累,叠加搜索、浏览器等场景优势,将成为智谱AI强有力的研发合作伙伴,同时在训练数据、强化学习、工程调优、用户场景和商业化等方面带来有益补充。我们相信,在双方的紧密协作下,大模型技术将获得更加广泛、深入的落地场景,赋能更多行业。
据了解,通过此次合作,360形成了自主研发+合作研发“双引擎”驱动的大模型布局。今年3月,360自研的千亿级大模型“360GPT”亮相,已经在智能搜索、AI生图等场景测评中取得亮眼成绩。360GLM与360GPT两个千亿级模型在能力上各有优势,相为补充,未来在应用层将实现无缝对接,为用户提供丝滑的使用体验。智谱AI也将在本次合作的基础上,进一步拓展、加深大模型技术的应用落地,帮助更多行业提升效率与体验。
国内首例ChatGPT研发模式成功复刻,360与智谱AI达成战略合作,推出gpt-3.5-turbo,大幅提升语言模型能力。这是当前最先进的语言模型,其输出结果已经丝毫难以区分人工智能和人类。一起来看看这次合作背后的故事吧!
1. 模式复刻与技术创新
模式复刻是指在既有模型基础上,进行数据、参数等方面的重新调整,以提升输出质量、速度等性能。基于ChatGPT算法的NLP技术,实现了全球范围内的最先进的语言模型。360和智谱AI团队利用模式复刻技术,将ChatGPT算法进一步扩展,推出了更快、更强大的gpt-3.5-turbo。
除了复刻技术,360与智谱AI还在技术创新方面作出了许多贡献,例如在模型训练方面进行了多种参数调优,优化了数据准备工作,打造了更高效的训练平台等。
2. 模型能力升级与应用场景拓展
ChatGPT算法基于自回归式生成模型,能够生成连贯、自然语言表达,使得场景生成和话题表达更加流畅自然,优化了搜索引擎、问答系统等应用。而gpt-3.5-turbo在原有的基础上,进行了数倍的性能升级,并增加了更多先进的自监督训练模式,实现了从文本生成到文本理解的全流程智能化。
除了搜索引擎、问答系统外,gpt-3.5-turbo也可用于智能客服、文本摘要、机器翻译、情感分析以及智能写作等领域。它使得人工智能的应用更加广泛、更加普及,为传统行业和新兴行业提供了很大的发展空间。
3. 协作与未来发展
360与智谱AI在ChatGPT算法的基础上,进行了更深层次的技术创新和协作,并共同推出gpt-3.5-turbo,实现了语言模型从“学说”到“跑得更快”和“理解更透彻”的全面升级。
在由智能化赋能的产业升级浪潮下,语言模型的技术不断向前,市场需求不断扩大,不断增长的带宽、处理能力和存储空间必然会使得gpt-3.5-turbo的性能持续升级。360和智谱AI将继续在语言模型领域进行深入合作,并共同探究语言模型在未来的发展方向。