图片来源@Unsplash,基于CC0协议!
今年的百度AI开发者大会上,李彦宏的一句“芯片依赖进口曾是我们永远的痛!”让现场与会者感慨不已,被外国技术“卡脖子”的现状是中国科技、产业界耿耿于怀的短板。不久前的中兴事件更是令国人痛定思痛,不在核心技术上夺回自主权,中国的发展就永远无法摆脱受制于人的困境。这次大会上,李彦宏这句话并不是单纯的发感慨,他随即宣布百度推出的AI芯片“昆仑”令人眼前一亮,这款芯片不但以260万亿次/秒的运算速度成为业内算例最强的AI芯片,更重要的是,其非GPU架构也为国产芯片摆脱GPU领先者的压制,实现弯道超车带来希望。
目前,AI领域已经成为世界科技巨头争夺的制高点,软件领域的谷歌、Facbook,硬件厂商英伟达、英特尔等全都宣布了自己的芯片规划以及未来远景。在这个大背景下,以百度昆仑芯片为代表的国产技术,能够突破国际巨头技术体系的压制,已经成为国内业界普遍关注的问题。李彦宏在本次发布会上宣布,昆仑系列芯片可以提供推理以及训练量大功能,为AI应用提供了强大的 “中国芯”,值得期待。
突破GPU瓶颈
我们都知道,人工智能AI领域长期以来都被称为GPU的世界。最早的CPU计算并不能很好地满足AI应用在运算模式上的需求,自从英伟达独创地将GPU引入AI领域以来,GPU的并行计算模式就一起高性能形成了统治地位。由于GPU的广泛采用,已经令主要生产商英伟达成为了事实上的领导者。
但是GPU存在一个问题,就是在功耗与性能的平衡上效果并不够理想。尤其在AI应用大量需要云端计算、计算中心对处理器的需求量大量增加的情况下,GPU由于价格以及耗能方面的弱点,令业界纷纷开始寻求GPU以外的解决方案。
而这中趋势,正是百度昆仑芯片得以发展的机遇。据了解,百度昆仑芯片分内两种型号:专注于训练方面的是昆仑818-300。而专注于推理功能的是昆仑818-100。两种芯片采用的均为14nm工艺,内部聚合了数万个小核心。
昆仑芯片尤其令业界瞩目的,是其运算能力。与近期出现的基于FPGA架构的AI加速器相比较,昆仑的性能提升了惊人的30倍。业界普遍认为,昆仑芯片很可能是采用了ASIC架构。
这种新架构应用的推出,标志着中国AI技术正在朝着绕过GPU瓶颈,实现弯道超车的方向前进。
面向未来
百度的昆仑芯片,与不久前寒武纪发布的麒麟芯片经常被人们拿来做对比。事实上,这两种芯片的应用场景是不一样的。
麒麟搭载的寒武纪NPU主要面向本地小型设备,是将AI运算本地化、轻量化的设计。而百度昆仑则是面向云端的重计算AI应用,尤其是那些对深度学习有很大需求的厂商以及研究机构,更是急需昆仑这样的国产芯片。
未来,依托昆仑芯片世界一流的强大算力,百度的无人驾驶、图像识别等AI应用将会取得更多、更新的进展。在5G时代即将来临之际,云端AI计算所适用的场景也将越来越多见,百度厚积薄发的AI研发投入,也将帮助企业在未来的AI应用大爆发中取得先机。