GPU后端深度学习主流芯片 国内已有多个替代方案
- 来源:中国安防行业网
- 2019/6/13 8:56:3335320
【安防展览网 时事聚焦】随着人工智能的快速发展,对算力提出了更高的要求,传统CPU已经难以满足人工智能高性能并行计算的需求。云端AI芯片的出现解决了目前这一瓶颈问题。相比于前端,后端设备更适合于更大规模的人工智能的应用。由于后端设备的空间、能耗、环境等的限制相对较少,便于对更大规模的数据进行深度处理。
GPU后端主流深度学习芯片
现阶段各大安防监控厂商也将人工智能技术竞争的焦点集中于后端,纷纷推出新产品。如海康威视的“脸谱”系列人脸分析服务器、大华的“睿智”视频服务器、苏州科达的DeepEngine深度学习服务器等。另外,智能化的后端设备也能更好利用当前的非智能前端设备,在无需大规模改造前端设备的条件下实现安防监控系统的智能化升级。
GPU是目前主流的深度学习后端芯片方案。对比CPU,GPU的更多核心和其并行处理架构使其成为天然的图形计算系统。利用GPU做图形计算,可以做到比CPU计算5倍以上性能提升,价格降低6倍,功耗降低10倍,体积减少20倍。对于安防企业而言,借助基于GPU开发的模块既能够满足图像处理要求,又适合于处理计算密度高、逻辑分支简单的大规模数据并行负载,将会成为进行海量视频数据结构化处理的关键。
国内厂商推出多个GPU替代方案
但GPU方案并非优,已有基于FPGA/ASIC芯片的新尝试。虽然服务器端可以布置多块GPU,但多路视频解码会对服务器造成压力,而这对GPU来说并不擅长。且GPU实际上是利用相关成熟的技术提供一种通用级的解决方法来满足深度学习的要求,缺乏针对专业应用解决方案,使得其能效受到限制。为此,各路芯片及安防厂商在积极寻求更优化的方案。
目前已有厂商针对安防监控后端推出了GPU的替代方案。2018年10月份,华为自研的云端AI芯片昇腾系列,基于达芬奇架构的华为昇腾910。在年底,华为又推出了基于ARM的服务器芯片“Hi1620”,采用台积电7nm工艺制造,在ARMv8架构的基础上,华为自主设计了代号“TaiShan”(泰山)的核心,支持48核心、64核心+2.6/3.0GHz配置。百度发布AI“昆仑”芯片,它是目前行业内运行速度快的智能芯片。
成立于2016年的寒武纪,成立之初就发布了世界*商用深度学习专用处理器寒武纪1A处理器(Cambricon-1A),并成为个成功流片并拥有成熟产品的AI芯片公司,拥有终端AI处理器IP和云端高性能AI芯片两条产品线。其中中科曙光与寒武纪合作,在新的人工智能服务器Phaneron中搭载寒武纪的深度学习ASIC芯片,在深度学习应用中比传统的CPU/GPU在性能、功耗和芯片面积方面均有较大优势,有望在安防监控领域落地应用。
2017年,比特大陆推出其AI品牌Sophon(算丰),并发布其代云端AI芯片张量计算处理器BM1680,适用于 CNN / RNN / DNN 的训练和推理。BM1680 单芯片能够提供 2TFlops 单精度加速计算能力,芯片由 64 NPU 构成。2018 年比特大陆发布第 2 代算丰 AI 芯片 BM1682,计算力有大幅提升。同时,今年10月份比特大陆基于云端芯片BM1682还发布了算丰智能服务器SA3。