设为首页 - 加入收藏 朝阳站长网 (http://www.0421zz.com)- 国内知名站长资讯网站,提供最新最全的站长资讯,创业经验,网站建设等!
热搜: 水平 系统 2019 vivo
当前位置: 首页 > 运营中心 > 建站资源 > 优化 > 正文

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

发布时间:2019-09-21 19:03 所属栏目:[优化] 来源:乾明
导读:本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。 每一次华为新动作,点赞有之,质疑亦随之。 9月18日刚在全联接大会上发布的全球最快AI产品就是这样。 但在现

本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。

每一次华为新动作,点赞有之,质疑亦随之。

9月18日刚在全联接大会上发布的“全球最快AI产品”就是这样。

但在现场、在华为内部来看,这只不过是“华为计算战略”艰苦奋斗的开花结果,只是这盘芯片和计算力大棋局里关键一子。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

△?华为Cloud & AI产品与服务总裁侯金龙

而且相比Atlas(古希腊神话里的“大力神”),实际不到三年时间里,华为已经发布了10款商用芯片:

鲲鹏916、920;麒麟970、980、810、990、990 5G;昇腾310、910;鸿鹄818。

按外泄的规划,接下来的两年内,至少有6款芯片发布落地。

无论是计算领域,还是半导体行业,如此阵仗,势头都异常猛烈。

所以背后原因究竟是什么?华为又究竟想做什么?

计算战略发布后,是时候对这盘大棋来次完整起底,揭秘华为在计算背后的种种规划与布局。

15年苦功夫,目前投入2万名工程师

围绕计算这个产业投资,十几年前已经开始了。

其中最具标志性的事件是2004年4月,旗下芯片公司海思半导体成立。

??华为Cloud & AI产品与服务总裁侯金龙透露了这背后的投入:

从2004年开始投资研发第一颗嵌入式处理芯片,目前投入超过2万名工程师,形成了以“鲲鹏+昇腾”为核心的基础芯片族。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

基础芯片族带来的意义非常直接。华为成为了业界唯一同时拥有计算架构中“CPU,NPU,存储控制,网络互连,智能管理”5大关键芯片的厂商。

但俱往矣。

从产品发布的节奏来看,华为对芯片投资的力度还在快速加强,迭代也越来越快。

华为投资芯片的策略,此前也有曝光,总结起来就是三个关键词:量产一代、研发一代、规划一代。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

以鲲鹏系列处理器为例,从2007年走到现在已历时12年,现在是第三代芯片。

现在华为释放出的最新信号是:鲲鹏+昇腾会长期演进,按照每年推出一代的节奏来提升竞争力。

这也是华为在不到3年内推出10款芯片的直接推动力量之一。

当然,上述种种努力和产品,只是果,细究“因”,则是华为对于行业变迁趋势的核心判断。

华为芯的机会:趋势变迁下的2万亿市场

在华为看来,当前的计算产业正在发生深刻的变化,尤其是整个社会向智能时代的迈进,这带来了变革与挑战,也带来了机会。

全联接大会上,胡厚崑援引了Gartner的数据——全球计算产业总空间为两万亿美元。在他看来,这是一片大蓝海,华为将坚定在计算领域的投入,并推进落地。

侯金龙进一步阐释四大趋势,也可以说是华为投资芯片进入这一蓝海的主要切入点:

首先,数据中心不够用了

对于数据中心来说,以前其承担的职能更多的是存、但未来更重要的是算,数据中心正在逐步演变为计算中心。

最直接的体现就是,大规模数据中心中赌圣越来越多。就以华为云的数据中心为例,有60%都是用于计算的赌圣。

可以说,计算正在成为数据中心的主体,这就是华为推动鲲鹏系列芯片的重要原因之一,也是鲲鹏芯片的使用场景。

与此同时,整个行业对AI算力需求也越来越大,而且来得更加汹涌,从2012年到2018年,AI算力消耗几乎增长了30万倍。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

现在每年的增长超过10倍,到2025年,AI算力将会占据数据中心算力的80%以上。

正是在如此算力需求下,华为推出了昇腾910以及Altas 900等AI计算产品。

其次,端边芯片与中心芯片还有大差距

在华为看来,Arm在生态上的优势会逐渐向数据中心延伸。对于华为来说,这是挑战,也是机会。

现场,侯金龙也分享了一组数据:

2018年,Arm处理器出货量230亿片,主要用于端和边,数据中心侧只有3000万片,这是数百倍的差距。

每年十几亿部手机都是Arm结构的,2019年华为智能手机总的算力,将是今年全球数据中心新增算力的2倍,而且手机上的几百万应用都是基于Arm生态。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

以前基于Arm的技术,之所以不能在数据中心使用,核心的限制是性能。

但解决问题导向,华为现已找到对策。

其今年发布的鲲鹏920是兼容Arm,多核、高并发,把四颗核心并入了一颗核心,其性能超过业内通用CPU 20%的性能。

而且现在的计算,可以让简单的计算在终端进行,复杂的计算可以在云上进。

如果继续用X86架构在云上计算终端的任务,效率就会降低40%,反之如果运用Arm架构,则提升40%。

第三,计算该绿

高性能的计算虽然更有效率,但背后也有大量的碳排放。

美国马萨诸塞大学阿姆赫斯特分校做过研究,训练一个单一AI模型,会产生180吨的碳排放。

这相当于普通汽车整个服役期排放量的3倍,平均地球人30年日常生活的碳排放。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

算力与效率背后,也需要对能源与环境更友好。从芯片层面上来看,要在更小的功耗下实现更高的性能。

在这方面,华为的底气很足。

侯金龙说,华为的Atlas 900 AI训练集群,算力达到256 PFLOPS只需要16个机柜。

要实现这样的算力,如果用CPU需要6195个机柜, 用GPU需要208个机柜,而NPU如昇腾只要128个机柜。

起底华为计算战略:十五年研发下苦功,三年连发10芯加速

这背后,主要归功于昇腾架构对深度学习业务的优化。

此外,经过华为系统级优化,如板级液冷、柜级密闭绝热等,整个集群的功耗从4万kW降到736kW,降低50多倍。

最后,摩尔定律放缓已成事实

经过数十年的快速迭代发展,高速的摩尔定律已经难以实现。

过去5年,通用CPU的发展遇到了许多技术瓶颈,单核性能平均每年提升不足10%,摩尔定律放缓已经成为事实。

想要进一步实现提高技术能力,在晶体管上打主意太难了,需要寻找其他路径。

【免责声明】本站内容转载自互联网,其相关言论仅代表作者个人观点绝非权威,不代表本站立场。如您发现内容存在版权问题,请提交相关链接至邮箱:bqsm@foxmail.com,我们将及时予以处理。

网友评论
推荐文章