分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2019-01-03 合作期刊: 《计算机应用研究》
摘要: 目前,现有的卷积神经网络由于其结构复杂且依赖的数据集庞大,难以满足某些实际应用或者计算平台对运算性能的要求和能耗的限制。针对这些应用或计算平台,对基于ARM+FPGA平台的二值化算法进行了研究,并设计了二值神经网络,该网络减少了数据对存储单元的需求量,也降低了运算的复杂度。在ARM+FPGA平台内部实现时,通过将卷积的乘累加运算转换为XNOR逻辑运算和popcount等操作,提高了整体的运算效率,降低了对能源和资源的消耗。同时,根据二值神经网络中数据存储的特点,提出了新的行处理改进算法,提高了网络的吞吐量。总之,该实现方式在GOPS、能源和资源效率方面均优于现有的FPGA神经网络加速方法。
分类: 计算机科学 >> 计算机科学的集成理论 提交时间: 2018-11-29 合作期刊: 《计算机应用研究》
摘要: 卷积神经网络的高计算复杂性阻碍其广泛用于实时和低功耗应用,现有软件实现方案难以满足卷积神经网络对运算性能与功耗的要求,传统面向FPGA的卷积神经网络构造方式具有流程复杂、周期较长和优化空间较小等问题。针对该问题,根据卷积神经网络计算模式的特点,提出一种面向云端FPGA的卷积神经网络加速器的设计及其调度机制。通过借鉴基于HLS技术、引入循环切割参数和对卷积层循环重排的设计,采用模块化方式构造网络,并进行参数拓展以进一步优化加速器处理过程;通过分析系统任务和资源的特性总结调度方案,且从控制流和数据流两方面对其进行优化设计。与其他已有工作相比,所提出的设计提供了一种同时具有灵活性,低能耗、高能效和高性能的解决方案,并且探讨了加速器的高效通用调度方案。实验结果表明,与CPU实现相比,该设计实现AlexNet达到8.48倍的加速,而实现Cifar的功耗仅为其24.96%;相较于CPU+GPU实现对Cifar6.90倍的加速比,虽然实现较大规模网络的性能不及GPU,但功耗最小仅为其14.98%;与已有研究成果相比,最大达到6.29倍的加速比。其中与大平台生成的加速器相比,即使仅达到相当的性能,但具有更低的时钟频率。
分类: 天文学 >> 天文学 提交时间: 2017-09-26 合作期刊: 《天文研究与技术》
摘要: 谱线观测在天文领域起着至关重要的作用,较高的频谱分辨率可以为研究天体细节带来便利,但在高频段谱线观测领域,使用传统的采样方法实现较高的谱线分辨率十分困难。目前,一种利用高性能芯片实现的用于射电天文厘米一分米波谱线观测领域的新方法克服了传统方法的诸多弊端,使用较低的采样带宽就可实现较高的频谱分辨率。这是一套完整的采集、处理、存储方案。首先将高频信号进行模拟下变频处理,再将处理过的低频信号交由上位机软件进行快速傅里叶变换、积分处理,最后保存成需要的文件格式。整个系统的采集参数由观测者通过上位机软件进行配置。
分类: 核科学技术 >> 核探测技术与核电子学 提交时间: 2024-04-07
摘要: 在现场快速准确地实现放射性核素活度测量在放射性医学诊断中具有重要作用。本文采用电容积分式的电路结构,设计了低噪声前置放大器电路,并与高精度信号采集与处理电路相配合,成功研制了弱电流测量电路,实现了20 fA~10 μA弱电流测量。结合前端井型电离室,搭建了电容积分式放射性活度计的原型装置。测试结果表明:本文研制的放射性活度计重复性与商用RM-905A性能基本一致,本底小于0.065 MBq,重复性不超过0.84%,不稳定性为1.94%。