深度学习的火热GPU面临严峻挑战

时间: 2024-06-19 19:16:09 |   作者: kaiyun体育官方网页

  兴起之后,安防行业就成为了人工智能技术最大的试验田,也是落地的主要场景之一。

  对于视频监控行业来说,在GPU的CUBA模块出现后(相关链接:为何GPU能在安防行业呼风唤雨?十几年前这件事改变了安防前端格局),前端摄像机对GPU的依赖就越来越重,一台摄像机能够搭载什么样的,算力又如何非常大程度上取决于GPU的性能。

  然而安防行业是一个场景化的行业,GPU再好也有着它的局限性。在AI发展的浪潮下,慢慢的变多的安防企业选择自研芯片来适应更细分的需求。

  各个安防企业都铆足力气或自研或合作生产安防芯片,几乎每隔几天就能蹦出一条非GPU安防芯片问世的新闻,在这个势头下,不少人都在心里打鼓:“是否GPU的王朝就要结束了?”

  王朝是否结束先按下不表,但从2019年全年智能安防芯片的产出来看,ASICFPGA表现优秀,更是有专家这样认为,在细分场景的深度学习方面安防芯片已经展现出了良好的发展的新趋势,那么我们今年就来看一下2019年安防芯片得到了哪些发展机遇,又有哪些安防芯片表现出不俗的竞争力。

  在传统的认知中,算法的深度学习都依赖GPU的CUBA模块,根据吴恩达教授在2011的实验根据结果得出,12颗英伟达GPU能够给大家提供相当于2000颗CPU的深度学习性能。

  但CPU作为图像处理器时,设计初衷是为了应对图像处理中的大规模并行计算。因此应用于深度学习时有明显的局限性。

  首先就是硬件结构完全由GPU厂商决定(主要是英伟达),其次是在深度学习方面,其效能远低于ASIC及FPGA芯片。

  通俗的讲,采用GPU,你能定制场景化的算法,但硬件性能以及发挥的效率完全是由英伟达决定,且算法的复杂程度还需要卡GPU的效能决定。

  尽管GPU目前依靠其优秀的编程环境和顶尖的算力依旧稳坐AI芯片市场NO1的地位,但其他两种芯片已呈现出后来居上之势。

  算力的优势并不是凭空而来,传统的GPU虽然在算力上占尽优势,但存在严重的晶体管堆料的现象,导致其利用效率不高而且造成的功耗远高于其他两种芯片,对于以7X24小时运行的安防设备来说,这样的功耗很难接受。

  市场上虽然对这些缺点还算比较容忍,(毕竟客户主要更关心算力)。但长此以往无异于饮鸩止渴。

  在设计层面,由于摩尔定律的失效。7nm后制程升级越来越困难,GPU若想保持其算力优势势必还会走“堆料”的路子,在云端市场持续不断的发展的今天,这样的市场越来越难以为继。也导致不少安防厂商纷纷开发自己的ASIC和终端的FPGA市场。

  由一家独大,到如今隐隐的三分天下之势,GPU确实该考虑怎么更好的适应市场了。

  在AI芯片选择方面,一般是有钱的选择ASIC,早期过渡和追求性价比会选择FPGA。

  FPGA的是很多勇于探索商业模式的公司初期选择的平台,深鉴、寒武纪、地平线、比特大陆都先后使用过FPGA,商汤等视觉公司也应用过FPGA+GPU的解决方案,但当业务发展到某些特定的程度后,都逐步开始转向ASIC。

  这是由于其芯片结构决定的,FPGA相比GPU功耗更低,相比ASIC具有更短的开发时间和更低的开发成本。

  一句话总结就是方便、性能好价格低。且由于英特尔于2015年收购了最成功的的FPGA芯片厂商Altera(151亿美元的天价,必须得说英特尔也是给CPU研发部门下了“死命令”),近年来不断推出CPU+FPGA的组合给各个行业都带来了前所未有的AI发展机遇。

  且由于近两年业界对于深度的学习能力大为推崇,在这方面具有优势的FPGA无疑就成为了很多厂商的选择。

  相比性价比较高的FPGA,ASIC芯片无疑就彰显了定制化芯片的霸气。除了不能像FPGA那样进行功能扩展和重构以外,ASIC芯片几乎满足了所有安防高端定制化的需求,在功耗、可靠性、体积方面优势很大,尤其是在移动端,其高性能、低功耗的特点成为了众多厂商的首选。

  尤其是人工智能越来越深度化的当下,人类对于智能化深度的要求慢慢的升高。相对应的芯片需要运行的算法也慢慢变得复杂,这都要求芯片拥有一套专用的架构与其进行对应,而ASIC芯片完美地满足了这一需求。

  而ASIC应用的典型的代表就是知名的Alpha Go的大脑:谷歌研发的TPU芯片,其强大的深度学习能力和较低的功耗都让业内艳羡。

  不过研发ASIC芯片的一大难题就是其高昂的成本和较长的开发周期。目前,致力于研发AISC芯片的都是既擅长芯片研发又具备AI算法的行业巨头,适用于已经具有一定规模且需求场景化定制需求的安防大厂。

  不过不管谁将在这场竞争中胜出,GPU在安防行业中的衰落或将成为现实,而在AI芯片的竞争当中谁又能拔得头筹,这还要看他们具体和安防行业的适配程度。

  2019年,我国安防芯片取得了很大的成就,不管是泛用性极广的海思Hi3516CV500、昇腾系列、还是具有超高集成度的国科微GK7205/GK7205S、亦或是致力于智慧城市建设的地平线都向我们揭示了如今安防行业对于定制化AI芯片的渴求。

  在新的一年里,随着安防智能化的不断深入,AI芯片行业竞争也会愈加激烈,但无论如何这对于中国安防的发展,都是多了一种选择,也多了一份效能。

  应该怎么做? 用个人主机通常pytorch可以跑但是LexNet,AlexNet可能就直接就跑不动,怎么来实现更经济便捷的实现

  基础设施,人们仍然没有定论。如果 Mipsology 成功完成了研究实验,许多正受

  在如今的网络时代,错综复杂的大数据和网络环境,让传统信息处理理论、A与人工神经网络都

  、神经网络与卷积神经网络的应用 /

  的架构创新,为软件承接大模型训练和推理场景的AI计算提供了持续提升的硬件基础。

  中的应用与优势 /

  技术可以轻松又有效地提高语音识别的精度和效率,并且被大范围的应用于各种应用场景。本文将探讨

  最初是为图形渲染而设计的,但是由于其卓越的并行计算能力,它们很快被引入

  的秘密武器 /

  库变得很容易。早期的优势加上NVIDIA强大的社区支持意味着若使用NVIDIA

  ? /

  性的问题,从低级的运动控制(如:步行、跑步、打网球)到高级的认知任务。

  算法应用分析 /

  VL53L4CD TOF开发(4)----单次测量(One-Shot)模式

  【Vision Board创客营连载体验】基于RA8D1-Vision Board的自动路径规划小车