UniRepLKNet
作者:Xiaohan Ding, Yiyuan Zhang, Yixiao Ge, Sijie Zhao, Lin Song, Xiangyu Yue, Ying Shan
前言
目前大核卷积神经网络仍然存在两个问题:
- 没有明确的网络结构设计路线,只是参考了传统卷积神经网络和 Transformer 的设计;
- Transformer 在各种模态中都占据了主导地位,卷积神经网络在视觉以外是否也能如此。
本文做出了如下贡献:
- 提出了 4 条大核卷积神经网络的设计准则;
- 使用高效的注意力模块如 SE 增加模型深度
- 使用重参数化技术
- 根据任务决定卷积核大小,并且只在网络中后阶段使用大核
- 使用 卷积而不是大核卷积加深网络。
- 通过简单的前处理,大核卷积神经网络可以在其他模态中取得 SOTA.