第三个加速器 ShiDiannao,则是将AI加速器与传感器直连,从而减少内存通讯的开销,第四
个加速器PuDiannao则将加速器从只支持特定神经网络扩宽到支持多种常规机器学习算法,也
是后来寒武纪发展 AI 加速器的最关键核心逻辑:通用平台的设计概念的主要来源。
PuDiannao也是Diannao项目的最后一个工作。 随后,陈氏兄弟就提出了Cambricon指令集的思
想,试图在更为泛化的层面来完成 AI 加速器的设计。与前面几个架构比较之下,Cambricon
里试图针对 AI 算法,提取出更为细粒度,泛化性更强的建构基础,在更具原子性的基础上完
成硬件结构设计,从而提升了加速器的通用性。