AI产业化时代,行业需要一套怎样的创新底座

报道 1个月前 (06-29)

经授权转自微信公众号 GPLP(ID:gplpcn)

作者 | 李东耳

经过多年发展,在全球范围内,AI已经进入产业大时代。

比如,在即将召开的世界2021世界人工智能大会期间,关于AI发展的趋势,各专家学者及行业企业代表将结合RPA+金融、零售、制造、教育等行业落地情况,展望人工智能行业应用融合发展未来。

也就是说,种种迹象表明,AI技术正在得到大规模商业应用。

回顾AI技术的发展历史,7年前,人脸识别超越人眼准确率,突破工业红线,人工智能从一个学术问题转变为场景的应用问题。7年后的今天,人工智能在多个行业规模化应用,牵引形成众多上下游和应用生态,进一步转变为产业问题,走向产业化发展阶段。

因此,如何促进AI技术进一步产业化,以及提高AI产能的经济效益尤为重要。而在以往的AI产业发展中,虽然有大量的企业和个人投入其中,但仍有很多应用场景的智能化水平难以满足实际需要,这些都成为阻碍AI企业经营和产业发展的重要问题之一。

从国务院印发的《新一代人工智能发展规划》中的战略目标来看,到2020年,人工智能总体技术和应用与世界先进水平同步,人工智能产业成为新的重要经济增长点,人工智能技术应用成为改善民生的新途径;

到2025年,人工智能基础理论实现重大突破,部分技术与应用达到世界领先水平,人工智能成为我国产业升级和经济转型的主要动力,智能社会建设取得积极进展;

到2030年,人工智能理论、技术与应用总体达到世界领先水平,成为世界主要人工智能创新中心。

这就要求人工智能自身的行业产值和它所带动的其他行业的附加值,在2025年大约达到1:10的杠杆。也就是说人工智能每产生一万元的产能,它实际上对它所服务的行业会带来10万元的经济效益。为了实现这一宏大目标,人工智能产业自身也必须作出大变革,打破以往的针对需求专项定制、精耕细作的研发和生产模式,实现全面升级。

全新AI产业经济时代下的五大巨变

AI在经历了初期“各自为战”式的发展之后,已经在部分领域取得了关键性的突破。而在AI技术不断投入到商业化应用的过程中,人们发现以往的AI生产关系已经难以满足AI产业的发展,AI产业正向着新的方向发生转变——比如,AI应用半径越来越长、越来越多的长尾需求得到重视,由此导致大参数通用模型越来越成为AI产业发展的未来,算力模式也因此需要发生变化,同时产学研相结合的紧迫性也越来越突出。

在AI商业化方面,包括谷歌及微软早就展开了研究。比如,谷歌继成功研发了AlphaGo围棋机器人后,正在向着通用人工智能的方向努力。微软也在2019年向马斯克的人工智能公司OpenAI投资10亿美元,共同打造通用人工智能系统。

对此,很多AI行业大佬不约而同地观点一致:AI正在进入下一个时间点,一个从技术创新周期转入商业创新周期的时间点。

公开资料显示,自从AI技术可商用以后,目前已经在不少领域开始应用,不过,此前,这些应用往往都局限在单点突破方面,比如说在地铁里或者飞机场刷脸通行,一般而言,这类应用场景的特点之一就是高频,每天都会发生且流量相当巨大,投入产出比非常之高,然而对于那些应用频率低或较为分散、多样的应用场景,AI的存在感往往比较差一点。

随着物联网、智慧城市等概念的发展,在数字化背景下,这些长尾需求逐渐开始浮出水面,对人工智能的需求也越来越多——比如,在消防等公共安全领域,和共享单车停放等城市管理方面,人工智能虽然已经开始得到应用,不过,这些应用只解决了城市智慧化升级闭环的一部分,依然存在大量场景需要人力去做管理。同时,这些需求分散而小众,即便AI能够帮助人们完成其中一个需求或一个环节,但也成本高昂,那么这些AI对于提高整体效率的作用就十分有限。

因此,这需要AI能够尽可能地打通更多场景环节,而在深入各个业务链条、提高整体系统能力方面,人工智能,特别是其算法还有很大的提升空间,其中很重要的一点就体现在算法的生产关系层面。

伴随整个AI产业上下游应用需求的爆发,让AI应用半径不断增长的同时,也将单一AI技术已难以覆盖全部应用需求的现状及问题暴露出来——可以说由于AI技术无论是在技术层面还是成本层面的研发难度都很大,单一AI企业也难以同时对各种长尾需求进行研发,在这种背景下,这要求AI算法的生产关系必须发生改变,否则将难以满足这些产业的需求。具体来讲,这种变化就是由应用者根据自身需求自行进行算法的生产。

不过,在这个过程当中,如果由应用者自己开发,这就出现了另一个问题,那就是技术共识上的变化,也同时意味着单个企业需要不断加大研发投入,这对很多中小公司来讲有点难度——超大规模预训练模式是当前AI研发的热门,通过一个足够大的通用模型去做小的模型尽管可以极大地降低研发成本,然而,在以往的AI研究活动中,人们更倾向于提升模型精度,对于大规模参数的通用模型,特别是超大规模与训练模型,业界往往报以怀疑的态度,并提出过不少质疑。如这种模型的建立需要大量数据和算法支持以及算力成本,单纯一家企业是否有这样的研发能力就被很多人质疑。

GPT-3等模型的出现,打破了以往提升模型精度的主流思路,让大家看到超大规模与训练模型的可能性,扭转了人们的看法。资料显示,早在,2020年7月,OpenAI发布的具有1750亿参数量的GPT-3模型具备着通用性以及零样本泛化的能力,2021年1月,Google还发布了自然语言模型Switch Transformer,参数量更是达到万亿规模。一旦这种量级的模型进入到应用层面,那这就意味着算法将会变成一种公共基础设施,其他企业不需要自己做这方面的投入就可以实现数字化转型,从而带动整个产业升级。

只是,面对参数量为亿万规模的产业,又一个阻碍AI技术发展的影响因素出现了,这就是“算力”——过去历史说明,每年最新的网络、最好的技术对于算力的需求,几乎呈数量级地增长。其中,AI对算力的需求增长更是无穷无尽,如此,如果要实现产业升级,算力方面也需要同步跟进,否则很难实现产业的全面升级。

最后,除了技术共识、算力之外,作为人工智能水平衡量的一个重要指标,识别度与精确度如何提升也同样浮出水面,毕竟传统通用计算的计算模式不仅成本高,而且这种算力增长也已经无法满足当前AI发展对算力的需求,因此计算模式的调整也是当前AI产业的一个主要变化方向。

不同于传统技术,人工智能是一个非常依赖产学研的领域,最主要的表现之一,就是人工智能的迭代速度非常快,每年算法精度都会提升一个量级,各高校研究所几个月的时间里就会有大量重磅论文发表,AI产业对人工智能的创新成果也是远超各种传统行业。

伴随着这几个变化的产生,这不仅让AI产业分工发生了改变,更是让以往孤立的AI研究,比如,企业、学校、研究机构各自研究不同的AI方向愈加无法满足产业发展的需求,  因此,伴随着AI产业的发展,产学研结合就越来越重要——一方面,企业的研发生产需要学校、研究机构的理论支持;另一方面,学校、研究机构的科研机构也需要根据行业发展情况作指导,最新研究成果也需要通过企业来检验,这就要求学术研究要能为产业技术创新起到前哨作用,产业界也需要为学术研究提供真正有价值的研究课题,彼此相互促进,形成一个产学研相结合的循环。因此,在产学研协同越来越重要的当下,企业、高校、研究机构都需要一个大型的算法训练和验证的平台作为中间地带。

客观而言,相比传统技术,作为一个技术前沿的技术,人工智能技术的持续发展及更迭对产学研的诉求更强烈——它非常依赖于技术的突破,迭代速度也更快,只要算法精度提升一个量级就可以引发重磅论文及业内关注。

因此,在AI走向大规模产业化的过程当中,算力、模型及技术共识等等五大行业关键要素密不可分,与此同时,学校、企业及研究机构之间也同样愈加紧密,三者需要紧密结合。

AI产业经济的繁荣取决于AI本身的生产效率提升

无论生产关系还是算法、算力,这都指向了一个方向,那就是AI产业经济的繁荣取决于AI自身生产效率的提升。只有AI本身的生产效率得到充分提升,不断快速地满足日益增长的AI应用与协作需求,AI产业才能够持续繁荣发展。

而在AI生产效率提升过程当中,AI的技术价值尤为重要。

通常而言,AI的技术价值主要体现在两方面:更大的训练模型与更低的生产门槛。

更大的训练模型让开发者们可以在大参数模型上加上一些行业属性后,就可以快速解决行业中的各类细小问题;与此同时,这些大参数模型开放后,就将升级为AI产业的公共基础设施,为AI产业赋能的同时,为企业降本增效带来经济收益。这就是其行业价值。

更低的生产门槛则令开发者们无需筛选高质量训练数据,降低开发难度的同时,在大模型、大算力下获得理想结果,从而在降低AI生产要素的同时,让更多的人成为开发者。

具体来说,伴随着大规模、超大规模模型逐渐成为一个共享平台,这就意味着,无论从AI软硬件产业链到学府、研究机构,都可以通过大装置来加速实现从核心技术攻关到产业应用的突破,而在这个过程中,AI产业则会推动传统产业的数字化转型升级的速度,更高效地解决智慧城市的各种长尾需求。

除前面所说的GPT-3模型外,国内在大参数模型上也已经有了不少领先世界的突破。

比如,在2021年6月1日召开的2021北京智源大会上,北京智源人工智能研究院发布了新版超大规模智能模型悟道2.0,仅在参数水平上,悟道2.0就达到了1.75万亿,是GPT-3的10倍,比Google Switch Transformer预训练模型的1.6万亿还要多,悟道2.0的问世却仅比Switch Transformer晚了不足半年的时间。

国内的AI头部,商汤科技最近也提了一个很有意思的概念,叫AI大装置。

其全名叫SenseCore商汤AI大装置,目的是做一个生产超大型模型的基础平台。

据商汤介绍,SenseCore商汤AI大装置主要通过算力层、平台层、算法层,以基础设施方式输出模型,把AI能力输出到企业服务、城市管理和个人生活等三大落地方向中:算力层,商汤科技已在上海临港新片区投资建立了一个全新的AI算力中心(AIDC),计算峰值速度可达到3740 Petaflops,作为参考,OpenAI的千亿参数模型GPT-3完整训练一次,使用AIDC的算力理论上一天内即可完成;

平台层,SenseCore商汤AI大装置可以实现不同场景的算法模型的底层抽象,以模块化平台套件打造通用型服务平台。据悉,其融合了商汤自研的算法框架后已经可以达到接近90%的并行处理效率,实现900倍计算提速;

算法层,SenseCore商汤AI大装置据称包括各种算法工具箱,其海量算法不仅包括以往较为重视的高频应用场景算法,还包含了众多长尾低频场景的算法。

无论是在算力层、平台层、算法层,商汤科技的AI大装置都体现了全球AI产业的最新发展方向,也体现了商汤自己的一个目标——朝着规模化、低成本、通用化的AI算法方向发展,这就可以深度赋能中国AI产业,创造更多产业价值。

而伴随着越来越多的企业与开发者融入或使用到SenseCore商汤AI大装置,这让围绕SenseCore商汤AI大装置形成的AI生态也将不断形成产业生态。

至于以后AI产业究竟能够在多大程度上推动传统产业升级转型发展,并且满足城市管理各种长尾需求,我们拭目以待。