自去年底chatgpt爆火以来,没有哪个企业能够抵挡住ai大模型带来的诱惑。截至目前,国内已有近百个大模型发布,这其中整体可以分为两类,一类是chatgpt掀起风口后临时起意开启的项目;另一类是已有多年积累,只是选择在此时祭出。
华为正是后者中的强者,经过数次迭代,盘古大模型3.0正式掀起行业高潮!
盘古3.0,遥遥领先
华为创立于1987年,是全球领先的ict(信息与通信)基础设施和智能终端提供商。作为一家名声在外的企业,华为的业务领域十分广泛,除了通信与手机等广被知晓外,在ai方面,华为云推出的盘古大模型也是一个独特的存在。
回顾过去,华为盘古大模型早在2020年就已启动研发,2021年4月正式发布。
2023年7月7日下午,在华为开发者大会2023(cloud)上,盘古大模型3.0正式揭开面纱,“为行业而生”的定位成为其最大的亮点。
在发布会上,华为常务董事、华为云ceo张平安等对盘古大模型进行了全面阐述,称其“不作诗,只做事”,并喊出口号“ai for industries”。
作为中国首个全栈自主的ai大模型,盘古3.0包括“5 n x”三层架构,分别对应l0基础大模型、l1行业大模型、l2场景模型。
l0层是五个基础大模型,分别为nlp、多模态、cv、预测、科学计算大模型,提供满足行业场景中的多种技能需求。
盘古nlp大模型
业界首个超千亿参数的中文预训练大模型,利用大数据预训练、对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。
功能上,盘古nlp大模型拥有海量数据集,通过对中文词汇、语法、语义等特征的深度分析,持续优化基础模型,打造业界最强中文理解/生成能力;优秀的推理能力,采用文本 代码融合训练的方式,不仅需要从文本中提取信息,还需要理解代码的语义和逻辑及与文本之间的关系,提升思维链推理能力;多任务促进,不同任务间具备强大的迁移能力,它所掌握的知识和技能可以轻松地转移到其他相关任务中,帮助模型更快地学习新任务,循环促进优化;多模型调优,支持在不同领域任务中分别使用小模型进行特定领域的训练和优化,提高模型的使用效率和准确性,优质完成多领域任务;多插件补齐,llm成为连接应用生态的中枢,支持如知识图谱,搜索,符号引擎等,补足机制性缺陷,提高盘古nlp大模型整体性能;全场景覆盖,支持行业知识问答,文案创作等多项能力,覆盖政务、金融、电商、能源等领域,低使用门槛助力多场景ai应用落地。
盘古cv大模型
基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型,赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。
该模型支持图像分类、物体检测、姿态估计等近10种微调任务,覆盖大部分视觉感知场景;可根据提示对图片中的目标进行检测,解决场景碎片化问题,无需提供训练数据;可根据提示对图片中的目标进行分割,常在辅助标注、aigc等场景应用。
cv大模型结合数据检索及数据增广技术,相对传统训练方式,数据需求减少80%以上;受益于更好的语义对齐效果,在小样本学习上表现优异,显著超越对比方法;利用行业模型高效表征及数据筛选能力,数据处理效率提升5倍以上。
盘古多模态大模型
融合语言和视觉跨模态信息,实现图像生成、图像理解、3d生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。
多模态大模型功能上原生支持中文,拥有亿级中文图文,百万中文关键词,更佳中文理解能力。可以更精准理解语义,实现精准图文描述、对齐语义理解、智能语境识别。也更具自然美感,多模态多尺度训练,逼近自然美感生成内容。拥有更强泛化性,适应各种复杂的应用场景和用户需求。并且基于昇腾云服务,全栈自主可控,也支持行业客户二次训练专属模型,打造大模型体验。
盘古预测大模型
面向结构化数据,基于神经网络transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力。
该模型通过对数据元特征进行建模,得到更准确和全面的数据信息,进一步优化凯发客户端登录的解决方案,提高模型能力。基于下游任务数据集的元特征,可通过预训练的搜索推荐模型,得到更适配的预处理方式和基模型集合。通过动态图对选择的基模型输出结果进行融合,得到基模型的最佳融合方式,进一步提升任务性能。
盘古科学计算大模型
面向气象、医药、水务、机械、航天航空等领域,融合ai数据建模和ai方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用ai模型更快更准的解决科学计算问题
模型使用3d earth-specific transformer基本框架,对输入的13×1440×721×5的高空变量和1440×721×4的地表变量进行关联训练,精准识别大气中不同高度的气象特征和相互关系;基于盘古药物分子大模型,以参考化合物为起点,支持80 种属性限制约束,从参考化合物到改造化合物的类药性质一览无余,方便迭代优化,得到性质更优、结构新颖的化合物;基于盘古药物分子大模型,在秒级内完成化合物的 admet 相关的 80 多种成药性质的预测以及药物可合成性的分数评估,以雷达图的方式直观展示,更好地辅助药物分子设计。
华为云盘古气象大模型研究成果在《nature》正刊发表
l1层是n个行业大模型,如政务、金融、制造、药物分子、矿山、铁路、气象等大模型。除提供以上使用行业公开数据训练的行业通用大模型外,还可以基于客户自有数据,在l0和l1层上训练专有大模型。
l2层是为客户提供的更多细化场景模型,如政务热线、网点助手、供应链物流、先导药物筛选、台风路径预测等,为客户提供“开箱即用”的模型服务。
另外,还有一点值得关注的是,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
从这一系列的产品特征中不难发现ai for industries的决心,也正是因为如此,盘古大模型已经在政务、金融、制造、煤矿、铁路、制药、气象等各行各业投入使用。
以正式商用的矿山大模型为例,华为盘古解决了人工智能在矿山领域落地难的问题。通过引入 ai 大模型视觉识别能力,卸压钻孔施工质量进行智能分析,辅助防冲部门进行防冲卸压工程规范性验证,降低了82%的人工审核工作量,并将原本需要3天的防冲卸压施工监管流程缩短至10分钟,实现了防冲工程100%验收率。
在2023世界人工智能大会上,华为轮值董事长胡厚崑就曾表示,华为云盘古大模型面向tob千行百业。华为人工智能的发展关键是走深向实,着力点放在让人工智能为千行百业的生产活动服务,为科研创新服务。
当然,盘古大模型也并非完全抛弃c端用户。
8月4日,华为开发者大会正式发布华为鸿蒙4(harmonyos 4),该操作系统与盘古大模型进行了融合,以改进人机交互。
特别是全新的ai小艺可以通过对自然对话的理解,识别出用户意图,很多操作不需要用户用专业的术语表达,小艺都可以明白并执行。并且ai小艺可以通过语音及文字交互,帮用户整理资讯、辅助生成文案生成、图片二次创作等。
遥遥领先的背后
从成为5g王者,到芯片实现全面突破,再到盘古大模型的强势入局,有太多的因素铸就华为如今的实力,而其中最不容忽视的是研发。
8月,华为发布2023年上半年财报,数据显示上半年华为营收3082.90亿元,同比增长3.2%,净利润465.23亿元,同比暴涨218%。而研发投入达到826.04亿元,同比增长4.4%。
官方数据显示,华为近十年累计投入的研发费用超过人民币9773亿元,2022年研发费用支出约为人民币1,615亿元,占全年收入的25.1%。
另外,2022年底研发员工约11.4万名,占总员工数量的55.4%,在全球共持有有效授权专利超过12万件。
这惊人的数据背后所展现的不仅是华为对于技术的卓越追求,是雄厚实力的最佳映射,更是深耕底层的决心。
因此,华为才能在多个领域爆发出惊人的成就。
竟是凯发客户端登录“全才”
也许是在其传统业务上太过耀眼,使得华为在新领域的地位被掩盖,比如元宇宙。
元宇宙是众多高新技术融合的产物,是技术进步的必然趋势。一般认为,元宇宙包括六大核心技术,分别是:人工智能技术、网络及运算技术、区块链技术、交互技术、电子游戏技术、物联网技术。是这些技术的发展推动了元宇宙的进步,谁在这些技术领域拥有一席之地,谁就将在未来的元宇宙产业中占据重要地位。
而华为就是这么一个以技术见长的企业,并且这六项技术一个不落。
人工智能方面前文已作介绍,这里不再赘述。网络及运算、物联网技术是华为的传统强项,华为的5g冠绝全球,云计算、边缘计算、iot同样出众。
区块链技术方面,华为拥有自家区块链平台,基于开源技术,构建多领域、多场景的区块链方案。今年2月在印尼举行的华为云亚太区凯发客户端登录的合作伙伴领袖峰会上,华为云还牵头启动了metaverse & web3.0联盟。
交互方面,华为近年还发布了数款xr硬件产品,比如华为vrglass、华为 vr glass 6dof,以及vision glass等。甚至6月还公布一项脑机接口专利。
电子游戏技术方面,华为拥有凤凰引擎,开源了数据虚拟化引擎华为河图,还也和北京首钢园合作上线“首钢园元宇宙”。
细数下来,华为在这六大技术方面都有技术积累和布局。专利方面,2月初,韩国特许厅曾对全球国家的元宇宙相关专利进行统计,华为的专利数量全球第四,国内排名第一。
综上所述,说华为是国内元宇宙企业的“最强王者”也毫不过分。
毋庸置疑的未来
未来的世界将是什么样子?我们认为华为一直以来坚持的愿景和使命已经给出了答案:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
2023年初,国家发布《数字中国建设整体布局规划》,其中提到数字中国建设的目标是以信息化、智能化、网络化等手段,推动各行业的数字化转型。而构建数字经济体系和数字社会体系是政策措施的重点内容。
华为的愿景契合了数字中国、数字经济的国家战略,也是元宇宙等新兴业态发展的核心所在。
另据数据,2022 年我国数字经济规模达到 50.2 万亿元,同比名义增长 10.3%,连续 11 年显著高于同期 gdp名义增速。并且数字经济占 gdp 比重达到 41.5%。
从这些不难看出,未来市场的机遇所在,华为未来的路又将多么宽广,也正是这些让我们笃定华为的愿景终将实现,因为华为的愿景正是这个时代的愿景。
当然,华为的道路也并非一帆风顺,未来还将有哪些艰难险阻,欢迎与我们一同探讨。
自去年底chatgpt爆火以来,没有哪个企业能够抵挡住ai大模型带来的诱惑。截至目前,国内已有近百个大模型发布,这其中整体可以分为两类,一类是chatgpt掀起风口后临时起意开启的项目;另一类是已有多年积累,只是选择在此时祭出。
华为正是后者中的强者,经过数次迭代,盘古大模型3.0正式掀起行业高潮!
盘古3.0,遥遥领先
华为创立于1987年,是全球领先的ict(信息与通信)基础设施和智能终端提供商。作为一家名声在外的企业,华为的业务领域十分广泛,除了通信与手机等广被知晓外,在ai方面,华为云推出的盘古大模型也是一个独特的存在。
回顾过去,华为盘古大模型早在2020年就已启动研发,2021年4月正式发布。
2023年7月7日下午,在华为开发者大会2023(cloud)上,盘古大模型3.0正式揭开面纱,“为行业而生”的定位成为其最大的亮点。
在发布会上,华为常务董事、华为云ceo张平安等对盘古大模型进行了全面阐述,称其“不作诗,只做事”,并喊出口号“ai for industries”。
作为中国首个全栈自主的ai大模型,盘古3.0包括“5 n x”三层架构,分别对应l0基础大模型、l1行业大模型、l2场景模型。
l0层是五个基础大模型,分别为nlp、多模态、cv、预测、科学计算大模型,提供满足行业场景中的多种技能需求。
§
盘古nlp大模型
§
业界首个超千亿参数的中文预训练大模型,利用大数据预训练、对多源丰富知识相结合,并通过持续学习吸收海量文本数据,不断提升模型的效果。
功能上,盘古nlp大模型拥有海量数据集,通过对中文词汇、语法、语义等特征的深度分析,持续优化基础模型,打造业界最强中文理解/生成能力;优秀的推理能力,采用文本 代码融合训练的方式,不仅需要从文本中提取信息,还需要理解代码的语义和逻辑及与文本之间的关系,提升思维链推理能力;多任务促进,不同任务间具备强大的迁移能力,它所掌握的知识和技能可以轻松地转移到其他相关任务中,帮助模型更快地学习新任务,循环促进优化;多模型调优,支持在不同领域任务中分别使用小模型进行特定领域的训练和优化,提高模型的使用效率和准确性,优质完成多领域任务;多插件补齐,llm成为连接应用生态的中枢,支持如知识图谱,搜索,符号引擎等,补足机制性缺陷,提高盘古nlp大模型整体性能;全场景覆盖,支持行业知识问答,文案创作等多项能力,覆盖政务、金融、电商、能源等领域,低使用门槛助力多场景ai应用落地。
§
盘古cv大模型
§
基于海量图像、视频数据和盘古独特技术构筑的视觉基础模型,赋能行业客户利用少量场景数据对模型微调即可实现特定场景任务。
该模型支持图像分类、物体检测、姿态估计等近10种微调任务,覆盖大部分视觉感知场景;可根据提示对图片中的目标进行检测,解决场景碎片化问题,无需提供训练数据;可根据提示对图片中的目标进行分割,常在辅助标注、aigc等场景应用。
cv大模型结合数据检索及数据增广技术,相对传统训练方式,数据需求减少80%以上;受益于更好的语义对齐效果,在小样本学习上表现优异,显著超越对比方法;利用行业模型高效表征及数据筛选能力,数据处理效率提升5倍以上。
§
盘古多模态大模型
§
融合语言和视觉跨模态信息,实现图像生成、图像理解、3d生成和视频生成等应用,面向产业智能化转型提供跨模态能力底座。
多模态大模型功能上原生支持中文,拥有亿级中文图文,百万中文关键词,更佳中文理解能力。可以更精准理解语义,实现精准图文描述、对齐语义理解、智能语境识别。也更具自然美感,多模态多尺度训练,逼近自然美感生成内容。拥有更强泛化性,适应各种复杂的应用场景和用户需求。并且基于昇腾云服务,全栈自主可控,也支持行业客户二次训练专属模型,打造大模型体验。
§
盘古预测大模型
§
面向结构化数据,基于神经网络transformer架构,通过任务理解、模型推荐、模型融合技术,构建通用的预测能力。
该模型通过对数据元特征进行建模,得到更准确和全面的数据信息,进一步优化凯发客户端登录的解决方案,提高模型能力。基于下游任务数据集的元特征,可通过预训练的搜索推荐模型,得到更适配的预处理方式和基模型集合。通过动态图对选择的基模型输出结果进行融合,得到基模型的最佳融合方式,进一步提升任务性能。
§
盘古科学计算大模型
§
面向气象、医药、水务、机械、航天航空等领域,融合ai数据建模和ai方程求解的方法;从海量的数据中提取出数理规律,使用神经网络编码微分方程;使用ai模型更快更准的解决科学计算问题
模型使用3d earth-specific transformer基本框架,对输入的13×1440×721×5的高空变量和1440×721×4的地表变量进行关联训练,精准识别大气中不同高度的气象特征和相互关系;基于盘古药物分子大模型,以参考化合物为起点,支持80 种属性限制约束,从参考化合物到改造化合物的类药性质一览无余,方便迭代优化,得到性质更优、结构新颖的化合物;基于盘古药物分子大模型,在秒级内完成化合物的 admet 相关的 80 多种成药性质的预测以及药物可合成性的分数评估,以雷达图的方式直观展示,更好地辅助药物分子设计。
华为云盘古气象大模型研究成果在《nature》正刊发表
l1层是n个行业大模型,如政务、金融、制造、药物分子、矿山、铁路、气象等大模型。除提供以上使用行业公开数据训练的行业通用大模型外,还可以基于客户自有数据,在l0和l1层上训练专有大模型。
l2层是为客户提供的更多细化场景模型,如政务热线、网点助手、供应链物流、先导药物筛选、台风路径预测等,为客户提供“开箱即用”的模型服务。
另外,还有一点值得关注的是,盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。
从这一系列的产品特征中不难发现ai for industries的决心,也正是因为如此,盘古大模型已经在政务、金融、制造、煤矿、铁路、制药、气象等各行各业投入使用。
以正式商用的矿山大模型为例,华为盘古解决了人工智能在矿山领域落地难的问题。通过引入 ai 大模型视觉识别能力,卸压钻孔施工质量进行智能分析,辅助防冲部门进行防冲卸压工程规范性验证,降低了82%的人工审核工作量,并将原本需要3天的防冲卸压施工监管流程缩短至10分钟,实现了防冲工程100%验收率。
在2023世界人工智能大会上,华为轮值董事长胡厚崑就曾表示,华为云盘古大模型面向tob千行百业。华为人工智能的发展关键是走深向实,着力点放在让人工智能为千行百业的生产活动服务,为科研创新服务。
当然,盘古大模型也并非完全抛弃c端用户。
8月4日,华为开发者大会正式发布华为鸿蒙4(harmonyos 4),该操作系统与盘古大模型进行了融合,以改进人机交互。
特别是全新的ai小艺可以通过对自然对话的理解,识别出用户意图,很多操作不需要用户用专业的术语表达,小艺都可以明白并执行。并且ai小艺可以通过语音及文字交互,帮用户整理资讯、辅助生成文案生成、图片二次创作等。
遥遥领先的背后
从成为5g王者,到芯片实现全面突破,再到盘古大模型的强势入局,有太多的因素铸就华为如今的实力,而其中最不容忽视的是研发。
8月,华为发布2023年上半年财报,数据显示上半年华为营收3082.90亿元,同比增长3.2%,净利润465.23亿元,同比暴涨218%。而研发投入达到826.04亿元,同比增长4.4%。
官方数据显示,华为近十年累计投入的研发费用超过人民币9773亿元,2022年研发费用支出约为人民币1,615亿元,占全年收入的25.1%。
另外,2022年底研发员工约11.4万名,占总员工数量的55.4%,在全球共持有有效授权专利超过12万件。
这惊人的数据背后所展现的不仅是华为对于技术的卓越追求,是雄厚实力的最佳映射,更是深耕底层的决心。
因此,华为才能在多个领域爆发出惊人的成就。
竟是元宇宙“全才”
也许是在其传统业务上太过耀眼,使得华为在新领域的地位被掩盖,比如元宇宙。
元宇宙是众多高新技术融合的产物,是技术进步的必然趋势。一般认为,元宇宙包括六大核心技术,分别是:人工智能技术、网络及运算技术、区块链技术、交互技术、电子游戏技术、物联网技术。是这些技术的发展推动了元宇宙的进步,谁在这些技术领域拥有一席之地,谁就将在未来的元宇宙产业中占据重要地位。
而华为就是这么一个以技术见长的企业,并且这六项技术一个不落。
人工智能方面前文已作介绍,这里不再赘述。网络及运算、物联网技术是华为的传统强项,华为的5g冠绝全球,云计算、边缘计算、iot同样出众。
区块链技术方面,华为拥有自家区块链平台,基于开源技术,构建多领域、多场景的区块链方案。今年2月在印尼举行的华为云亚太区凯发客户端登录的合作伙伴领袖峰会上,华为云还牵头启动了metaverse & web3.0联盟。
交互方面,华为近年还发布了数款xr硬件产品,比如华为vrglass、华为 vr glass 6dof,以及vision glass等。甚至6月还公布一项脑机接口专利。
电子游戏技术方面,华为拥有凤凰引擎,开源了数据虚拟化引擎华为河图,还也和北京首钢园合作上线“首钢园元宇宙”。
细数下来,华为在这六大技术方面都有技术积累和布局。专利方面,2月初,韩国特许厅曾对全球国家的元宇宙相关专利进行统计,华为的专利数量全球第四,国内排名第一。
综上所述,说华为是国内元宇宙企业的“最强王者”也毫不过分。
毋庸置疑的未来
未来的世界将是什么样子?我们认为华为一直以来坚持的愿景和使命已经给出了答案:把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界。
2023年初,国家发布《数字中国建设整体布局规划》,其中提到数字中国建设的目标是以信息化、智能化、网络化等手段,推动各行业的数字化转型。而构建数字经济体系和数字社会体系是政策措施的重点内容。
华为的愿景契合了数字中国、数字经济的国家战略,也是元宇宙等新兴业态发展的核心所在。
另据数据,2022 年我国数字经济规模达到 50.2 万亿元,同比名义增长 10.3%,连续 11 年显著高于同期 gdp名义增速。并且数字经济占 gdp 比重达到 41.5%。
从这些不难看出,未来市场的机遇所在,华为未来的路又将多么宽广,也正是这些让我们笃定华为的愿景终将实现,因为华为的愿景正是这个时代的愿景。
当然,华为的道路也并非一帆风顺,未来还将有哪些艰难险阻,欢迎与我们一同探讨。