第十五届“挑战杯”全国大学生课外学术科技作品竞赛 二等奖
深度学习在各个领域的应用广泛。本文从软件和硬件两方面出发,设计了一个能高效执行深度神经网络运算的硬件体系结构。软件方面,我们详细分析了深度学习中常见的网络层的计算和存储需求,开发出了一套方法针对硬件计算来对神经网络进行精度调整简化、压缩;体系结构方面,根据分时复用和数据流的设计思想,设计了一套高效的存储结构和计算模型;并从底层的硬件运算中抽象出了一套指令集来描述神经网路中的运算。