人工智能作为新一代产业变革的核心驱动力之一,其发展已经从大炼模型逐步迈向炼大模型的阶段通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,从而服务更多的企业,正在成为人工智能发展的新趋势
机器人小科亮相国家十三五科技创新成就展,冬奥手语播报数字人在北京电视台上岗。
尽管公众对大模型的概念和它背后的技术突破还一知半解,却已对悟道2.0大规模智能模型驱动下的这些应用不再陌生。在药物优化方面,实现了对筛选出的先导药物的针对性优化。
2021年,北京智源人工智能研究院发布悟道大模型,连创中国首个世界最大纪录。。
以此为标志,越来越多的研究机构,企业加入到炼大模型和推动智能普惠的队伍中,在世界人工智能技术发展和应用中贡献中国智慧和力量。
开闸放电普惠社会
日前,由智源研究院,清华大学等多个单位联合打造的悟道2.0发布其参数规模达1.75万亿,打破了之前由国外预训练模型创造的1.6万亿的参数纪录,成为中国首个,全球最大的万亿级预训练模型
智源研究院学术副院长,清华大学教授唐杰介绍,完全基于国产超算GPU平台打造的悟道2.0取得了多项世界级的创新突破,在预训练模型架构,微调算法,高效预训练框架方面实现了原始理论创新,在世界公认的人工智能能力排名榜单上,取得9项能力的领先地位。在药物生成方面,实现了小分子化合物独特信息的深度表征,目标蛋白的计算与匹配,新分子生化性质的预测,从而高效生成新药分子。
为提升大规模预训练模型的产业普适性和易用性,悟道团队搭建的高效预训练框架,实现了全链路的原创突破或迭代优化,预训练效率大幅提升。据介绍,华为云与中国科学院上海药物研究所联合培养了华为云盘古药物分子模型。
需求多样化与场景碎片化是AI落地普遍存在的难点悟道开放平台在快捷易用的同时,更注重解决规模化,产业化AI应用问题唐杰表示,悟道大模型具备低门槛+高效率+高情商的特点,能够满足不同行业和企业实现规模化,产业化的应用需求任何企业,开发者拿到完全开源的悟道2.0预训练框架后,都可以快速部署并应用于实际业务中
OPPO旗下开放式对话虚拟语音助手小布,基于悟道大模型开启的生成式回答系统,一举解决了行业共通性的长尾问题,单条回答建设成本降低99%。
高效的机器翻译,智能的对话客服和语音播报在电商,媒体,教育,智能硬件等领域已经表现出极大的发展空间,验证了大模型铺就的迈向通用人工智能的路径极富潜力。
智源研究院理事长张宏江指出:未来,大模型会形成类似电网的智能基础平台,像发电厂一样为全社会源源不断供应‘智力源’,高效普惠各行各业。
悟道2.0超大规模智能模型训练技术体系,为我国人工智能应用构建的基础设施,已开始为传统行业智能化改造和升级开闸放电。
打造新型研发机制
悟道大模型实现了我国在超大规模智能模型技术的自主可控及前沿引领智源研究院院长黄铁军从三个角度对于研发机制给予了解释
一方面,是新时代集中力量办大事的科研组织模式,即保持对重大科学问题的敏锐眼光,以需求导向和问题导向布局重大科研任务,建立大任务快速论证启动机制,组建跨机构,大协同,高强度的科研团队,解决大问题另一方面,以人才为中心,鼓励自由探索,坚持求真务实,不论资排辈的人才发展模式,坚持以代表作和小同行评价遴选人才,让想干事,能干事的青年人才挑大梁当主角
智源研究院立志要做‘永远年轻的研究院’,注重对青年学者的吸引,期待与青年学者共同创造科研新范式张宏江说,智源推崇‘代表作文化’,不问出身,不看论文数,只看是否取得标杆性成就,有没有成为标杆的潜力
唐杰表示,未来智源研究院将继续推进机制创新,既要顶天,也要立地在吸引更多学者加入,创造出更多类似悟道大模型的科研代表作,推动北京率先成为国际领先的人工智能创新中心的同时,打造生态,连接技术与产业,推动人工智能产业发展和深度应用
产学研相继入场
站在新三年计划的起点,悟道将围绕提智能,降门槛,建生态多个角度,进一步向更好用迈进。
伴随着越来越多的研究机构和技术公司入场,以虚拟数字人为典型代表的,基于大模型应用的技术创新和产业成果在我国全面开花。
日前,浪潮人工智能研究院发布人工智能巨量模型——源1.0,它发布时,已几乎读完了近5年的中文互联网浩瀚内容。盘古药物分子模型依托华为云一站式医疗研发平台EIHealth,学习了17亿个药物分子的化学结构。
浪潮信息副总裁刘军表示,巨量化的一个核心特征就是模型参数多,训练数据量大源1.0参数量高达2457亿,训练数据集规模达到5000GB
如中国工程院院士王恩东所言,让机器像人类一样具有逻辑,意识和推理等认知能力,一直是计算机科学探索,研究的重要方向在较好解决感知智能问题后,这轮人工智能的发展,已经进入通过各种创新解决更复杂的认知智能问题的发展阶段
黄铁军说:人工智能是新一代产业变革的核心驱动力,它的发展已经从‘大炼模型’逐步迈向‘炼大模型’通过设计先进的算法,整合尽可能多的数据,汇聚大量算力,集约化地训练大模型,供大量企业使用,是必然趋势
。