改变世界的硬件加速技术
社会越来越先进,人们对生活品质的要求也越来越高。在以前,长途跋涉,几天几夜不足为奇,今天,旅程超过一天,这滋味也让人苦不堪言。以前,PC软件的进度条带给人期待。今天,进度条却给人带来苦恼。Cpu!为什么你不能更快一点呢?
晶体管工艺已经遵循摩尔定律半个世纪了,晶体管体积越来越小,集成度越来越高,功耗也越来越低,可为什么速度却没有同等程度的大幅度提升呢?
图1
图2
由上图可以看出。晶体管的工艺越来越高,体积越来越小,然而晶体管的速度似乎已经达到了极限。可以比较明确的看出,晶体管的开关最高速度稳定在4G左右。这和当前的Intel I7系列CPU速度基本吻合。想要超频只能增加功耗(指数级功耗增长)和降低温度,然而这两种方式代价太大。
现在的软件开销越来越大,cpu主频也无法提升,软件加速算法也不能改变计算量巨大这一本质,因此大规模的硬件加速得到的广泛的运用。
人类的机械设计,结构设计,电子设计其实都算的上是硬件加速,帮助人类提高生活,工作效率。在这里我要类介绍一下当今社会炙手可热的电子行业里的硬件加速。
1) 专用ASIC芯片加速
除了CPU之外。大部分带处理能力的芯片,其实都算是专用芯片,为其特殊的功能而定制。就那大家最熟悉的芯片来说。显卡芯片,大家都不陌生,专为显示而生,由于当前PC的显示器像素越来越高,显示效果也越来越复杂。想玩个大型游戏,想看个高清4k电影,工作中渲染个图片。不得不配一个较好的显卡,以解决显示卡顿这一难题,声卡同样的道理。手机也是如此,手机的cpu,再结合大量专用IC实现精简且功能强大的手机硬件系统。
图3nvidia显卡芯片
优点:运用设计开发简单,开发收周期短,开发成本低。
缺点:功能单一,不易更换场合使用,非量产成本较高。
2) 多核并行处理
单个CPU不够用,多个总够了吧。多核的使用,最大的好处就是,线程真正的实现并行处理了。单个核各干各的,最后在集中处理。N核芯片却不能带来N倍的效率,如果软件处理好的话也许每个核可以达到最高性能的70%,但往往,很难达到。手机性能吃紧的今天,安卓机也必须上多核,双核,4核,8核,相信16核已经不远了。
来看看PC端,民用cpu普遍4核左右。服务器端,CPU最高可达80核!想想80线程并行处理,是不是有点小激动,当然这个钱会让你更激。
图4intel 80核服务器芯片
优点:PCB设计简单,性能大幅度提升,价格不算贵。
缺点:开发难度高,需要大量的官方支持,会浪费很多无用资源。
3) 系统级硬件定制
专为系统定制设计IC。首先厂商设计产品时,基本已经确定IC的功能,以及定制软件软件所需的硬件环境。在所有参数都基本确定后再去为系统定制ASIC专用芯片。可以说是“硬件为软件而生,同时软件为硬件而生”。这样开发能力,目前来看也只有苹果可以做到。IPhone在硬件上并没有超高的配置,但整个系统硬件只为定制的软件工作,是的硬件的工作效率可以达到最高。苹果手机快就快在这里,我们来看看苹果表的芯片设计吧。
图5苹果表的硬件集成封装
优点:设计整体达到一个最精简的程度,将软硬件做到极致。
缺点:开发难度太大,普通企业无法实现。
4) 通用到定制的转变:FPGA
FPGA可编程芯片。可以为很多非消费级产品,提供非常高的性价比。
来看看FPGA一般的用途:
图6 CPU 与FPGA的功能描述
CPU像一个全能达人,什么事情都会,做什么都会很快。
FPGA像一群智商一般的普通人民,当然有的FPGA里面也有那么几个全能达人(自带硬核)。
全能达人虽然强,但是只有他一个人。普通人民虽然若,但是人口基数大。一旦让普通人民专注的做一件事情,速度当然会比达人快很多(并行处理)。当然普通民众还会很多特别的技巧(有的高端FPGA会自带很多高速模块 LVDS,GTP等等),这是达人无法学会的。
说回正题,在嵌入式,通信以及服务器市场,大部分处理器,在各自的设备中一直会执行特定的操作。在处理大数据流时,可以独立并行处理并搬运。专用芯片,设计相当复杂,环节多,投入高,周期长。一旦出错,流片损失就是几百万美元起。FPGA实现各式各样的功能,设计完毕即可调试,有错即改,没有出错成本。
目前FPGA的运用,已经进入大部分行业。(由于成本和功耗的原因,移动终端行业无法进入),成为嵌入式行业当中不可缺少的处理工具。由于FPGA 功能越来越强,芯片公司提供各种功能的算法,接口,存储模块,使FPGA开发更加简单。(但是开发,还是较复杂于软件)
IC巨人Intel预见了未来。2015年第二大芯片行业并购案。167亿美元拿下Altera。Altera 是FPGA领域不可否认的霸主,也是IC芯片利率唯一一家高过intel的芯片设计公司。Intel在确保获利的前提下,也为自己的未来进行了规划。服务器行业需要各式各样的处理算法来完成服务器的处理工作,然而不同的处理算法服务器的处理事务也不同。微软BING,百度搜索引擎的服务器均采用FPGA板卡加速,实现相应的搜素算法。处理速度提升两倍,服务器数量降低一半。Intel 已经开发了内嵌FPGA的xeon至强服务器CPU,2016年即可量产,想必未来的服务器市场必将迎来一次大换血。
图7采用FPGA定制的SRC Saturn服务器
优点:开发速度快,性能强大,而且可以适合多种场景。功能灵活多变。
确定:开发难度大,FPGA芯片成本相对较高。
未来谁也说不准,是专用,还是通用,高度集成,还是模块化分割,时间会给我们答案。
ZLG致远电子最新烧录一体机p800,全新的架构,CPU计算、FPGA硬件加速。实现单台设备智能多通道并行FLASH烧录,加速工业生产,降低生产成本。