
盘古大模型全面介绍

一、平台介绍
盘古大模型是由华为云、循环智能和鹏城实验室联合开发的人工智能模型,于 2021 年 4 月正式对外发布。作为面向 B 端行业的大模型,它包含 L0 中 5 类基础大模型、L1 行业大模型及 L2 场景模型三层架构,采用 “5+N+X” 分层体系,实现从通用能力到行业场景的精准适配。其覆盖自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算等多个领域,旨在为各行业提供强大的 AI 能力支撑,助力产业智能化升级 。
二、功能解析
1、自然语言处理(NLP)功能
基于海量训练数据,具备对话问答、文案生成、阅读理解等基础能力。如在智能客服场景,能快速理解客户问题并提供准确解答;在文案创作方面,可生成新闻稿件、广告文案、故事小说等多种文本。同时,还拥有代码生成能力,帮助开发者提升编程效率;支持插件调用与模型调用等高阶特性,拓展应用边界 。例如最新发布的 718B 深度思考模型,采用稀疏高效的 MOE 新架构,探索不同专家异构方式,昇腾亲和设计在超节点带宽通信优势明显,通过增加多语言、推理类数据,达到国内模型第一梯队水平。
2、计算机视觉(CV)功能
围绕工业、城市、政务等重点场景,打造通用视觉能力。可实现图像分类,精准识别各类物体所属类别;支持目标检测,快速定位图像或视频中的特定目标;进行图像分割,将图像中的不同对象精确分割出来。基于少量数据微调即可完成特定任务,如在安防监控中识别异常行为、工业质检中检测产品缺陷等。最新发布的视觉 MOE 大模型,参数量达 30B,支持多类型图像生成 。
3、多模态功能
融合语言和视觉等多种模态信息,实现图片描述,用准确语言描述图片内容;进行视觉问答,针对图片或视频中的内容回答相关问题;具备常用图像理解能力。通过将视觉理解能力接入对话大模型,丰富了多模态生成能力。如在智能导购中,用户上传服装图片,模型可推荐搭配方案并介绍相关产品信息 。最新发布的世界模型能够动态生成可交互、可漫游的数字空间。
4、预测功能
能够实现回归预测、分类、异常检测、时序预测等功能。在金融领域,可预测股票走势、信用风险;在工业生产中,预测设备故障、产量变化等,帮助企业提前规划,降低风险。该模型面向结构化任务,基于 triplet transformer 统一架构在预训练阶段完成跨模型通用知识学习,支持基于用户的结构化数据,针对跨领域下游任务进行微调,从而实现对事物发展趋势、状态类别等进行量化预测 。
5、科学计算功能
主要围绕气象场景构建科学计算能力,如盘古气象大模型可精准预测重力位势、湿度、风速、温度、海平面气压、降水等细粒度气象特征,速度相比传统数值预报大幅提升,在气象研究细分场景中优势显著。同时,也致力于将人工智能与生物医药、化学材料等前沿科学研究深度融合,打造高精度模型,助力科研突破 。
三、产品特色
1、全面的大模型系列
涵盖 NLP、CV、多模态、预测、科学计算等多领域基础模型,为不同行业、不同场景的应用开发提供丰富选择,满足多样化的 AI 需求 。
2、最全工具链平台
ModelArts Studio 大模型开发平台打造了业界最强、最全的大模型工具链。数据工程工具链可实现一站式数据工程,具备数据获取、清洗、合成、标注、评估、配比、流通和管理等功能,支持全模态数据类型,标注提效 10 倍 +;模型开发工具链预置盘古五大模型训练、部署流水线能力,支持预训练、全量微调、LoRA 微调,具备模型效果自动评估、压缩、部署等功能,实现 0 代码快速开发;应用开发工具链支持提示词工程和智能 Agent 应用创建,通过可视化编排工具加速大模型应用开发 。
3、零代码开发平台
ModelArts Studio 支持零代码与低代码开发方式,应用可外载知识库与插件,开箱即用。工作流可进行托拉拽的可视化编辑,降低开发门槛,即使是没有专业编程知识的人员也能轻易上手创建应用 。
4、高性能、低成本
基于昇腾高性能推理框架,ModelArts Studio 支持数据加速、训练加速和推理加速,支持分布式高效训练和推理,提供高性价比算力,帮助企业降低 AI 开发和应用成本 。
5、安全可靠
ModelArts Studio 大模型开发平台推理服务调用时支持英文等多语种内容安全拦截,支持恶意算子脚本 / 恶意 Prompt 拦截,从底层硬件到顶层应用采用完全自研技术栈,全面保护大模型平台上 AIGC 内容的安全访问,确保数据、模型、内容安全可控 。
四、适用人群
1、企业开发者
希望基于预训练模型进行微调或部署,快速开发出满足企业业务需求的 AI 应用,如开发智能客服系统、智能办公助手、生产流程预测与优化工具等 。
2、企业用户
不想进行复杂的模型部署,只想通过调用 API 将大模型能力集成到现有业务系统中,提升业务效率,如金融机构用于风险评估、政务部门用于智能审批、制造企业用于质量检测等 。
3、科研人员
借助盘古大模型探索模型结构和性能,在气象研究、科学计算、多模态融合研究等领域开展创新性研究工作,推动学术进步 。
4、行业专家
利用盘古大模型验证行业解决方案,将自身行业经验与大模型能力相结合,为行业难题提供创新解决思路,如医疗专家用于辅助疾病诊断与研究、建筑设计师用于设计方案优化等 。
五、应用场景和效果
1、金融领域
银行员工日常需查找人员信息、制度、流程等,并撰写大量报告、邮件、会议纪要等。借助盘古 NLP 大模型,可快速检索信息,辅助撰写文档,提升日常办公效率,减少工作时间成本 。在风险评估方面,盘古预测大模型通过分析大量金融数据,准确预测信用风险、市场波动等,帮助银行降低不良贷款率,提升资产质量 。
2、政务领域
人社局利用盘古多模态大模型,对不同事项接收到的电子材料,尤其是图片类材料,自动进行合规性审查和智能分类,实现事件处理全过程智能化管理。业务人员从繁重的数据整理、汇总和审查工作中解脱出来,办事处理效率大幅提高,民众办事等待时间显著缩短 。在智慧城市建设中,盘古 CV 大模型对重点城市数十万量级、区县城市几万量级的摄像头视频进行共享、汇聚、分析,从点到面全场景、立体化建设城市感知体系,提升城市治理水平 。
3、工业制造领域
在钢铁生产中,湖南钢铁集团、湖南移动、华为联合打造的钢铁行业盘古大模型应用,可对高炉炉温、铁水温度、硅含量等炉况进行仿真,辅助高炉精准控制,充分利用能源,降低能源成本,提高生产效率和产品质量 。在汽车工业设计中,盘古大模型能将新车造型设计周期从 1 – 2 年大幅缩短。设计师通过与模型交互,生成 3D 汽车数字模型,并进行风格化调整、零部件编辑、颜色更换等,生成的数字模型可直接输出成 3D 文件用于 3D 打印样品,减少制作油泥模型轮次,节省成本和时间 。
4、气象领域
盘古气象大模型能精准预测细粒度气象特征,速度比传统数值预报提升 1000 倍,提供秒级天气预报。欧洲中期预报中心和中央气象台等实测发现其优越性,预测结果包括重力位势、湿度、风速、温度、海平面气压、降水等,可直接应用于多个气象研究细分场景,助力气象灾害预警,保障社会生产生活安全 。
5、媒体内容生产领域
盘古大模型可将实拍视频快速转换成特定风格动漫,保持角色样貌、大运动轨迹一致;自动将视频译制成不同语言,保留原始音色、情感、语气,将译制配音、动漫生成等场景制作周期从月级缩短到天级,提升制作效率,实现作品一次拍摄多元化制作,价值最大化 。
六、使用指南
1、注册与接入
前往华为云官网,注册华为云账号。登录后,在产品与服务中找到盘古大模型服务,根据自身需求选择相应的基础模型或行业模型服务进行接入申请 。
2、数据准备(若需微调)
如果要对模型进行微调以适配特定业务场景,通过 ModelArts Studio 的数据工程工具链,从多样化数据来源渠道获取文本、文档、图像、视频等全模态数据。利用工具链的数据清洗、标注、评估等功能,为模型训练准备高质量数据集 。
3、模型调用与应用开发
对于直接调用模型 API 的用户,在获取 API 权限后,按照华为云提供的 API 文档说明,在自己的应用程序中编写代码调用模型服务,实现所需功能 。若进行应用开发,可使用 ModelArts Studio 的模型开发工具链进行 0 代码或低代码开发。通过可视化界面进行模型训练(若有微调需求)、部署等操作;利用应用开发工具链进行提示词工程设计和智能 Agent 应用创建,完成应用开发后进行测试与优化 。
4、应用部署与管理
开发完成并测试通过的应用,可部署到华为云平台或企业自有服务器(若符合相关条件)。在 ModelArts Studio 中对部署后的应用进行管理,监控应用运行状态、性能指标等,根据实际使用情况对模型或应用进行进一步调整和优化 。
七、发展历程
2020 年 3 月,曾在德克萨斯大学圣安东尼奥分校计算机系任教 17 年的田奇加入华为云团队,着手组建人工智能模型团队并梳理发展方向。同年 9 月,在众多专家加入后,团队推动盘古大模型项目立项,旨在基于华为云完成适配各大产业 AI 开发的大模型。11 月,项目在华为云内部正式立项,并完成与合作伙伴、高校的合作对接 。
2021 年 4 月,盘古大模型正式对外发布,推出 NLP、CV 和科学计算大模型;后续又陆续发布矿山、药物分子、气象、海浪等行业大模型 。
2023 年 7 月 7 日 – 9 日,华为开发者大会 2023 (Cloud) 举办,华为常务董事、华为云 CEO 张平安宣布华为云盘古大模型 3.0 发布。该版本分为 L0 基础大模型、L1 行业大模型、L2 场景模型三层架构,重点面向政务、金融、制造、医药、矿山、铁路、气象等行业,首次明确定位 “为行业而生”,同时公布盘古基础大模型的全栈创新和行业大模型的 “炼成术”,实现重大升级 。7 月 18 日,华为联合山东能源集团宣布盘古大模型在矿山领域首次商用,解决人工智能在矿山领域落地难问题。9 月 22 日,在华为全联接大会上,华为云计划以昇腾 AI 云服务为算力底座,以盘古大模型联合创新为基础,以模型社区和全面升级的云学堂为双引擎,携手伙伴、开发者共建 “百模千态” 。
2024 年 4 月 11 日,在华为鸿蒙生态春季沟通会上,全新的华为 MateBook X Pro 发布,首次将盘古大模型加持的 AI 功能应用于 PC,生成 “AI 概要” 场景模型。4 月 28 日,湖南钢铁集团、湖南移动、华为联合打造的钢铁行业盘古大模型应用全球首发。6 月 21 日,在华为开发者大会 2024 上,华为常务董事、华为云 CEO 张平安发布盘古大模型 5.0,在全系列、多模态、强思维三个方面全新升级,包括十亿级、百亿级、千亿级、万亿级等不同参数规模,提供多领域模型 。2025 年 5 月 20 日,华为云拉美 COMPASS 2025 大会宣布,华为云盘古西语及葡语 NLP 大模型计划于 2025 年第三季度正式发布,同时,华为云 CodeArts Pangu Doer 也计划在 Q3 上线 。
盘古大模型常见问题 FAQ
1、盘古大模型与其他大模型相比有什么优势?
答:盘古大模型具有全面的大模型系列,覆盖多领域;拥有业界最强最全的工具链平台,支持零代码与低代码开发;基于昇腾高性能推理框架,实现高性能、低成本;从底层到顶层采用全自研技术栈,保障数据、模型、内容安全可控。在行业覆盖深度与广度上领先,已在 30 多个行业、400 多个场景落地,能切实解决行业难题 。
2、使用盘古大模型需要具备专业的 AI 知识吗?
答:不需要。ModelArts Studio 大模型开发平台支持零代码与低代码开发方式,通过可视化界面操作,即使没有专业 AI 知识的人员也能轻松上手进行模型调用、应用开发等操作 。但如果涉及复杂的模型微调、深度的算法优化等工作,具备一定 AI 知识会更有助于操作 。
3、盘古大模型的数据安全如何保障?
答:从底层硬件到顶层应用采用完全自研技术栈,防止外部非法入侵。ModelArts Studio 大模型开发平台推理服务调用时支持多语种内容安全拦截以及恶意算子脚本 / 恶意 Prompt 拦截,保护数据在传输和使用过程中的安全。同时,严格遵守相关数据安全法规,保障用户数据隐私 。
4、企业可以对盘古大模型进行定制化开发吗?
答:可以。企业可利用 ModelArts Studio 的工具链,基于盘古基础大模型进行定制化开发。通过数据工程工具链准备企业特定数据,使用模型开发工具链进行预训练、微调等操作,开发出适配企业业务场景的行业大模型或场景模型 。
5、盘古大模型的服务费用是怎样的?
答:服务费用根据使用的模型类型(基础模型、行业模型)、使用量(如 API 调用次数、数据处理量、算力使用时长等)以及所选服务套餐等因素而定。具体费用可在华为云官网盘古大模型服务页面查看详细的计费说明,或联系华为云客服咨询 。
注:以上AI工具信息均来自于用户投稿或互联网上抓取或AI生成,品牌方如需调整以上介绍资料或者更新完善内容,请及时准备好内容联系AI神器榜客服。
数据统计
数据评估
关于盘古大模型特别声明
本站脑榜提供的盘古大模型都来源于网络,不保证外部链接的准确性和完整性,同时,对于该外部链接的指向,不由脑榜实际控制,在2025年7月24日 下午4:31收录时,该网页上的内容,都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,脑榜不承担任何责任。
相关导航

DeepSeek专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。基于自研训练框架、自建智算集群和万卡算力等资源,深度求索团队仅用半年时间便已发布并开源多个百亿级参数大模型,如DeepSeek-LLM通用大语言模型
暂无评论...