欢迎访问:沃派博客 每天不定时发布IT文章相关资讯
当前位置:沃派博客-沃派网 > IT文章 > 正文

平头哥出道一年,阿里芯片战略进展如何?

09-26 IT文章

(原标题:平头哥出道一年了)

平头哥出道一年,阿里芯片战略进展如何?


2018年云栖大会期间,阿里巴巴宣布成立一家独立运营的芯片公司——“平头哥半导体有限公司”。一年过去,阿里的芯片战略进展如何?

9月25日,阿里巴巴集团首席技术官兼阿里云智能总裁张建锋发布了阿里的首款AI芯片含光800,该芯片是一款云端AI芯片,属于AI推理芯片。含光800主要应用于视觉场景,已经在阿里巴巴集团内多个场景大规模应用,其他企业可以通过阿里云获得含光NPU的算力。

张建锋表示,平头哥用大概一年多的时间实现了含光800从设计到商用。

依托阿里资源

作为一个长周期的行业,要想加速芯片的商用,在硬件和软件方面都需要有很强的实力,特别是在AI时代,软硬一体化的重要性更加突显。

芯片厂商面临着技术路径的选择:CPU虽然能解决单次复杂问题,但无法支撑深度学习的大规模并行计算需求。GPU最初随着图像处理需求出现,处理大量数据并行运算、浮点运算的能力迎合了深度学习的需求,相比CPU处理速度更快、功耗更低,因此被最先引入深度学习。FPGA可以通过FPGA配置文件来定义这些门电路及存储器间的连线,从而实现特定的功能,并且可以通过配置特定的文件将FPGA转变为不同的处理器。虽然有可以多次更改的优势,但是在AI芯片的进展上不算快。ASIC则是为了特定应用而设计的集成电路,除了不能扩展以外,在功耗、可靠性、体积方面都有优势,在云端和终端上挤满了一众蓄势待发的AI厂商。

相比之下,含光800性能突破得益于软硬件的协同创新,芯片架构方面,含光800采用创新的架构,针对深度学习中使用的大量权重参数和张量数据,在支持稀疏压缩与量化处理的基础上,通过独特设计的数据访存与流水线处理技术,大大减低了I/O需求和数据的搬移。NPU同时深度优化了卷积、向量计算和各种激活函数,通过更有效的硬件资源调度和全并行的数据流处理,提升了AI运算的性能和能效。

平头哥借力于阿里在软硬件方面的积累。算法方面,阿里巴巴达摩院机器智能实验室过去两年构建了完整的算法体系,涵盖语音智能、语言技术、机器视觉、决策智能等方向,并且取得多个世界领先水平的成果;硬件方面,阿里巴巴此前已在服务器、FPGA以及存储等领域拥有多年研发经验,此外,平头哥团队在体系结构、编译技术等领域拥有深厚的技术储备。

其中,性能的提升必须解决内存墙问题。所谓的内存墙,是指采用冯诺依曼结构的处理器,存储和运算处理分离,当进行深度神经网络处理时,算力得到了提升,但大量读写运行操作会受到带宽限制,芯片的整体性能提升也同时受到限制。

平头哥的做法是通过自研架构大幅减少对内存的访问,在保证性能的情况下,把芯片功耗降到最低水平。具体而言,含光800会根据神经网络推理运算特征,设计特定的硬件、高速连接的存储结构以及专用指令集,对内存和计算单元实现高效组织管理,实现单条指令完成多个操作,提高计算效率和内存访问效率。

目前,含光800已应用于阿里巴巴集团内多个场景,例如视频图像识别/分类/搜索、城市大脑等,未来还可应用于医疗影像、自动驾驶等领域。

比如,拍立淘是手机淘宝上用图片搜索商品的一个功能,拍立淘商品库每天新增10亿商品图片,为了让用户快速从海量图片中精准搜索到商品,需要强大的计算力支撑,使用含光800搜索效率可提升12倍,时间从传统通用GPU的1小时缩减至5分钟。

“含光800芯片的设计、封装、测试等环节已完成,流片一次通过,现在在跟业务方做适配、验证的过程,预计今年年底可以完成主要业务方适配、验证的过程。”9月25日,阿里巴巴平头哥半导体公司研究员骄旸告诉第一财经记者,虽然取得了一些成绩,但要达到英伟达的水平还有一段很长的路要走。

含光800是一款云端AI芯片,后续会做PC、手机端上的芯片,用IP的形式去赋能客户。“先在云端做大芯片、技术上占领制高点,如果在云上做成了之后,客户对于公司在PC、手机等端上也会充满信心。”骄旸表示。

阿里官方表示,成立仅一年的芯片公司平头哥仅用7个月时间完成了前端设计,之后用3个月成功流片。“和绝大多数芯片商不同的是,平头哥的目的并非卖芯片,含光800将通过阿里云对外输出AI算力,未来企业可以通过阿里云获取含光800的算力。”

版权保护: 本文由 沃派博客-沃派网 编辑,转载请保留链接: http://www.bdice.cn/html/82490.html