两年前被质疑PPT造芯,如今再次宣称吊打英特尔!初创公司5.7GHz 128核通用CPU将流片!支持x86、ARM、RISC-V
Prodigy T16128有128个64位CPU内核,工作频率高达5.7GHz,有16个DDR5内存控制器和64个PCIe5.0通道,可以处理通用计算、高性能计算(HPC)和AI工作负载--所有这些都在一个芯片上。 Tachyum称Prodigy是世界上第一个"通用处理器",并表示它从一开始就被设计成一个多用途的CPU,能够运行世界上众多最密集的计算应用。Prodigy不仅能在单个芯片上处理所有这些不同的任务,而且其功率预算比传统硬件低10倍--而且成本只有三分之一。 Tachyum公司大胆地宣称,Prodigy超级计算机芯片在高性能计算应用中的性能是英特尔市场上最快的Xeon的四倍,是Nvidia的H100原始性能的三倍。所有这些,同时又是10倍的电源效率。 为了在单核架构中创造出如此令人印象深刻的性能,Tachyum表示,它在构建Prodigy时,从头到尾都有矩阵和矢量处理能力--而不是把它们作为事后的考虑。Prodigy支持一系列数据类型,包括FP64、FP32、TF32、BF16、Int8、FP8和TAI,所有这些都来自单个CPU核本身。 另一方面,Prodigy将能够在单个内核上运行光线追踪和人工智能应用,并且不需要将数据转移到微处理器内的另一个芯片上。 在单个芯片内运行所有这些不同的HPC工作负载可能会极大地改变服务器的格局。公司将能够把更多的芯片装入一个服务器场,并降低功率要求和冷却。 Prodigy T16128 采用5纳米,目前还没有透漏是哪家工艺。T16128在一个非常小的(就其提供的功率而言)64毫米×84毫米FCLGA封装内运行。Tachyum表示,当涉及到HPC工作负载时,该芯片能够执行12个AIPetaFLOPS和90 TeraFLOPS。Prodigy芯片还可以运行x86、ARM、RISC-V的二进制文件。从某种角度来看,单个Nvidia A100只能够实现5个AI PetaFLOPS。 每个核心具体能够实现2x 1024位矢量单元,4096位矩阵操作,以及每时钟4条失序指令。还支持虚拟化和高级RAS。该芯片还包括超过128MB的L2+L3高速缓存,具有纠错能力。为了给其所有的内核提供能量,该芯片配备了16个DDR5内存控制器,额定速度高达7200MT/s,每个插座的最大容量为8TB。 T16128是Tachyum公司Prodigy系列的旗舰型号,将于2023年开始生产,所以我们应该在明年某个时候看到这些芯片的实际基准测试。 T16128规格书截图:
初创公司Tachyum于2016年在硅谷成立,刚刚宣布已经准备好其旗舰处理器Tachyum Prodigy,这是一种小型128核处理器,根据制造商的说法,其功耗超仅仅是英特尔至强的1/10倍。该处理器将成为英特尔和AMD的竞争者吗?
该初创公司已获得斯洛伐克政府的1700万美元投资,希望在该国创造就业机会,所以该公司现在应该是一家斯洛伐克公司。Tachyum已经能够开始生产该处理器和更简单的64核型号,他们计划将其生产今年面市。
Tachyum的几位创始人都是美国人,且大有来头。尤其是CEO Radoslav Danilak,拥有25年的半导体行业经验,一度大红大紫的SSD主控巨头SandForce就是他创立的,还亲自担任CEO,后被希捷收购,后来又创立了Skyera,继续研究SSD主控技术,2014年又被西数收购。
Tachyum高管团队: