在 6 月 20 日盛大举行的华为开发者大会上,华为云的盘古大模型 5.5 正式揭开神秘面纱,以其全面的技术升级和广泛的应用拓展,成为大模型领域的焦点事件,为千行百业的智能化转型注入了强大动力。
盘古大模型 5.5 在自然语言处理、多模态、预测等五大基础模型上实现了全方位的升级。在自然语言大模型方面,华为推出了 7180 亿参数的深度思考模型,这一模型完全基于国产算力训练而成,具有里程碑式的意义。它在知识推理、自然科学、数学等领域的全球大模型榜单上表现卓越,位居前列,标志着我国在大模型训练能力上已达到世界一流水平。该模型在知识推理任务中,能够深入理解复杂的逻辑关系,精准地推导出结论。例如,在处理科学研究中的复杂问题时,它可以快速梳理大量的文献资料,准确地回答研究人员关于实验原理、数据推导等方面的问题,为科研工作提供有力的支持。在自然科学和数学领域,它能够高效地解决各类难题,无论是复杂的物理公式推导,还是抽象的数学问题求解,都能给出准确且详细的解答,大大提高了科研人员和学生在相关领域的工作和学习效率。
基于盘古多模态大模型,华为云创新发布了盘古世界模型,这一模型为智能驾驶、具身智能等前沿领域构建了可探索的数字训练空间。在智能驾驶领域,汽车企业可以借助盘古世界模型高效生成复杂场景数据,为端到端模型的快速迭代提供强力支撑。在实际应用中,通过模拟各种复杂的路况,如暴雨天气下的道路积水场景、早晚高峰时段的拥堵路段等,盘古世界模型能够生成大量对应的场景数据。这些数据可以让智能驾驶模型更好地学习和适应不同的驾驶环境,从而实现 “两天一个版本” 的高效迭代,不断提升智能驾驶系统的安全性和可靠性。而在具身智能方面,盘古世界模型还有望应用于火星车的避障训练。通过对数百张火星照片的增训,并结合模拟的深度信息,模型能够生成火星的数字物理空间。火星车可以在这个数字空间中进行对岩石抓取的模拟训练,从而提升其机械臂的操作能力,为未来在火星表面的实际作业做好充分准备。
同时,华为云发布的 CloudRobo 具身智能平台,致力于破解机器人智能化的瓶颈。为了实现机器人与云之间更高效、安全的连接,华为云提出了机器人到云的联接协议 R2C(Robot to Cloud),并积极倡导与机器人伙伴以及行业组织共同打造 R2C 开放协议。这一举措旨在让更多的机器人本体能够借助云计算的强大能力,拥有高效安全的智能。在工业生产中,通过 R2C 协议,工厂中的机器人可以实时将生产数据上传至云端,利用云端的盘古大模型进行数据分析和决策,然后根据反馈迅速调整生产动作,提高生产效率和产品质量。在物流配送领域,物流机器人可以通过该协议与云平台连接,实时获取最优的配送路线规划和货物搬运策略,实现物流配送的智能化和高效化。
盘古预测大模型采用了创新的 triplet transformer 统一预训练架构,能够融合处理表格、时序、图像等多源异构行业数据,显著提升了预测精度与跨场景泛化能力。在工业生产中,水泥企业利用盘古预测大模型优化配料方案,不仅增加了固废的利用,降低了生产成本,还提高了产品质量。钢铁企业通过该模型实现了高炉的精准控制,单炉日省燃料 20 吨,大大降低了能源消耗。在能源领域,云南铝业借助盘古预测大模型年省电 2600 万度,天津能源通过该模型达成 100% 供热均衡,有效提升了能源利用效率。
盘古 CV 大模型升级为业界最大的 300 亿参数 MoE 视觉大模型,支持多维度泛视觉感知、分析和决策。在安防监控中,该模型能够对监控视频中的人物、车辆等目标进行精准识别和跟踪,及时发现异常行为并发出警报。在智能零售领域,它可以通过分析顾客在店内的行为和表情,了解顾客的购物偏好,为商家提供精准的营销策略建议。盘古科学计算大模型也在不断加速拓展与更多科学应用领域的结合。例如,基于盘古大模型的深圳气象局 “智霁” 实现了 AI 集合预报,能够更准确地预测天气变化,为市民的出行和生产生活提供可靠的气象信息。重庆气象局 “天资・12h” 通过盘古大模型强化了灾害预警能力,在面对暴雨、台风等自然灾害时,能够提前发出更精准的预警信息,为防灾减灾工作争取更多的时间。能源企业利用盘古大模型提升了风光水发电的预测精度,更好地规划能源生产和供应,保障能源的稳定供应。
此外,华为云还发布了盘古医学、金融、政务、工业、汽车五个具备深度思考能力的行业自然语言大模型,并将于 6 月底正式上线。这些行业大模型将进一步加速各行业的智能化进程。在医疗行业,盘古医学大模型可以辅助医生进行疾病诊断,通过分析患者的病历、症状和检查结果,快速给出可能的疾病诊断建议和治疗方案参考,提高医疗诊断的准确性和效率。在金融领域,盘古金融大模型能够进行精准的风险评估,分析市场趋势,为金融机构的投资决策提供有力支持,降低金融风险。在政务方面,盘古政务大模型可以提高政府部门的办公效率,实现智能政务服务,如智能客服解答市民的政策咨询、智能审批加速政务流程等。在工业和汽车行业,大模型可以优化生产流程、提升产品质量和进行智能供应链管理。
华为云盘古大模型 5.5 的发布,充分展示了华为在大模型技术研发和应用落地方面的强大实力。通过不断的技术创新和产业合作,盘古大模型将在更多领域发挥重要作用,推动各行业的数字化转型和智能化升级,为经济社会的发展带来新的机遇和变革。
二、国产算力支撑下的大模型发展新突破
随着大模型技术的快速发展,算力作为其核心支撑,成为了行业竞争的关键因素。近期,我国在国产算力领域取得了一系列重要突破,为大模型的发展提供了坚实的基础。
在华为开发者大会上,华为宣布基于全新算力架构的 AI 云服务上线。该算力架构为 CloudMatrix 384 超节点,通过将 384 颗昇腾芯片和 192 颗鲲鹏芯片通过高速网络进行全对等互联,形成了一台超级 “AI 服务器”。这一架构具有 “高密、高速、高效” 等显著特点,在算力、互联带宽、内存带宽等主要性能指标上达到了世界先进水平。
CloudMatrix 384 超节点的高密特性,使得在有限的空间内能够集成更多的计算资源,提高了计算资源的利用效率。这对于大模型训练中需要处理海量数据的场景来说,尤为重要。高速的互联带宽确保了芯片之间的数据传输速度极快,大大减少了数据传输的延迟,使得各个芯片能够协同工作,高效地完成复杂的计算任务。而高效的性能则体现在其能够以更低的能耗完成更多的计算操作,降低了大模型训练的成本。
基于国产算力的提升,我国的大模型训练取得了显著进展。除了华为的盘古大模型 7180 亿参数深度思考模型外,其他国内企业和科研机构也在积极探索利用国产算力进行大模型的研发和优化。一些企业通过自主研发的芯片和算力平台,成功训练出了适用于特定领域的大模型。在农业领域,某企业利用国产算力训练出了农业病虫害预测大模型。该模型通过分析大量的气象数据、土壤数据、作物生长数据以及病虫害历史数据,能够准确预测病虫害的发生时间、范围和严重程度,为农民提供及时的预警和防治建议,保障了农业生产的安全。在交通领域,科研机构利用国产算力开发了智能交通流量预测大模型。该模型可以实时分析城市道路上的交通流量数据,结合历史交通数据和实时路况信息,预测未来一段时间内的交通流量变化,为交通管理部门优化交通信号控制、制定交通疏导方案提供科学依据,有效缓解了城市交通拥堵问题。
国产算力的发展也促进了大模型在中小企业中的应用。以往,由于算力成本高昂,中小企业难以开展大模型相关的业务。而现在,随着国产算力的普及和成本降低,中小企业能够以较低的成本接入国产算力平台,利用大模型技术提升自身的业务能力。一些从事电商业务的中小企业,通过接入国产算力支持的大模型服务,实现了智能客服功能。大模型能够快速准确地回答客户的咨询,提高了客户满意度和订单转化率。在制造业中,中小企业可以利用国产算力训练的质量检测大模型,对生产线上的产品进行实时检测,及时发现产品质量问题,提高产品质量和生产效率。
然而,国产算力在发展过程中也面临着一些挑战。一方面,虽然国产芯片和算力平台在性能上取得了很大进步,但与国际先进水平相比,在某些高端芯片技术和算力优化算法方面仍存在一定差距。另一方面,国产算力产业的生态建设还需要进一步完善,包括芯片制造、软件开发、应用推广等各个环节之间的协同合作还不够紧密。为了应对这些挑战,我国政府和企业加大了在算力技术研发方面的投入,鼓励企业和科研机构加强产学研合作,共同攻克关键技术难题。同时,积极推动国产算力产业生态的建设,引导产业链上下游企业加强合作,形成良好的产业发展环境。
总体来看,国产算力的发展为我国大模型技术的进步和应用拓展提供了有力支持。随着国产算力技术的不断突破和产业生态的逐步完善,相信在未来,我国的大模型将在更多领域取得创新性成果,推动各行业的智能化发展,提升我国在全球科技竞争中的地位。
|