学院新闻

首页 > 学院新闻 > 正文

深圳大学电子与信息工程学院博士生陈少武10月31日在雷达相关技术分论坛做了题为《深度神经网络压缩》的学术报告

发布时间：2022-03-30

2021年10月23-24、30-31日，第一届雷达学报博士论坛成功举办！

深圳大学陈少武10月31日在雷达相关技术分论坛做了题为《深度神经网络压缩》的学术报告。

近年来，利用深度学习，雷达信号处理领域实现对目标的高精度检测和实时跟踪。层数越来越多的深度模型带来了更高的模型精度，但这也令参数规模愈加庞大的模型无法嵌入到雷达系统所处的小算力平台。

为了解决这个问题，模型压缩方法应运而生。然而，以往的模型压缩方法只考虑了每个权重张量的独立冗余性，压缩效率较低，且性能衰减较大。为了取得更大的压缩倍率同时尽可能的保持原始模型精度，我们提出利用神经网络层间的共性，以耦合张量分解的方法压缩神经网络,使得不同层共享部分权重，进一步地压缩网络并实现网络推断加速。

前沿深度模型中存在大量重复的卷积层。我们假设这些位置一致、结构重复的卷积层的权重张量如 ω1，ω2具备耦合共性，即拥有独立分量与共享分量:其中为共享分量: ω1=ωs+ωi,1，ω2=ωs+ωi,2,其中ωs为共享分量,ωi,1和ωi,2分别为ω1，ω2的独立分量。据此，分别对他们的独立与共享分量进行张量分解实现耦合张量压缩（NC_CTD）：

ω1=ωs+ωi,1=Gs1*Gs2*Gs3+Gi11*Gi12*Gi13

ω2=ωs+ωi,2=Gs1*Gs2*Gs3+Gi21*Gi22*Gi23

通过控制秩的保留数目，可以控制参数压缩的倍率。而利用该压缩算法，等效地将一层卷积层替换为三层复杂度更低的卷积层，实现推断加速，如图1所示。

图1：NC_CTD分解压缩。

表1：在ImageNet数据集ResNet-34分类任务上的压缩结果。“CR”表示压缩倍率，“TT”为对比方法，“Accuracy”为对比指标。

表2：迁移学习任务上的网络压缩性能对比。“Time”表示单张图片的前向推断耗时。

如表1和表2所示，通过利用层间共性，耦合张量分解方法（NC-CTD）在不同数据集和任务上均取得了好于同类算法的性能表现，准确率高出基线方法0.5到1个百分点。同时，对比原网络的前向推断时间，NC-CTD方法实现了推断加速。

本报告PPT共27张。

陈少武，2019年毕业于深圳大学电子信息工程专业，目前在深圳大学多维信号处理实验室黄磊教授的指导下读取博士学位。研究兴趣包括矩阵与张量分解算法，深度神经网络压缩加速及其应用。

最新动态

办公地址

地址：深圳大学粤海校区致信楼电子与信息工程学院 (深圳市南山区南海大道3688号)

邮政编码：518060

联系方式

电子邮箱：ceie@szu.edu.cn

联系电话：0755-26536198

传真号码：0755-26536198

友情链接

国家科学技术部| 国家自然科学基金委| 中国电子学会

中国通信学会| 鹏城实验室

版权所有© 2022 深圳大学电子与信息工程学院