据IT之家6月5日消息,市场有消息称,华为大机型“盘古聊”已申请相关商标,将于7月7日发布。据证券时报报道,华为官方表示,华为不会有“盘古聊”这样的名字,也不会是“标杆”行业产品,但官方口径并没有直接提到盘古模型的发布。
IT之家查询公开资料获悉,华为盘古系列基础大模型将于2021年正式发布,包括NLP(自然语言处理)、CV(机器视觉)和科学计算大模型; 、海浪等行业模型。
据介绍,NLP是中国首个千亿参数预训练大模型,CV大模型首次达到30亿参数。 Pangu CV Large Model 业界最大的CV大模型,率先实现判别和生成能力,在小样本学习能力上业界首创; 盘古气象大模型提供二级天气预报; 紫东。 太初是全球首个图文音频三模态大模型。
对于盘古大模型的定位,华为内部团队确立了三个关键的核心设计原则:第一,模型要足够大,能够吸收海量数据; 泛化能力可以真正应用于各行各业的工作场景。
华为云官网显示,盘古大模型由NLP大模型、CV大模型、多模态大模型、科学计算大模型等多个大模型组成。 AI规模化、产业化问题,可支持多种自然语言处理任务,包括文本生成、文本分类、问答系统等。
华为表示,盘古NLP大模型由华为云、环路智能和鹏城实验室联合研发,具有领先的语言理解和模型生成能力:在权威的中文语言理解评测基准CLUE榜单中,盘古NLP大模型位列第一总排名、类别、阅读理解项目均排名第一,打破了三项排名的世界历史记录; 整体排名得分为83.046,多项子任务得分行业领先,向人类水平(85.61)迈进了一大步。
具体来说,首次使用盘古NLP大模型-架构,兼顾了NLP大模型的理解和生成能力,保证了模型嵌入不同系统的灵活性。 在下游应用中,只需要少量的样本和可学习的参数,就可以完成千亿级大规模模型的快速微调和下游适配。 该模型在智能舆情和智能营销方面均有良好表现。
发表评论