FCN-PanopticSeg
论文名称:Fully Convolutional Networks for Panoptic Segmentation
作者:Yanwei Li,Hengshuang Zhao,Xiaojuan Qi,Liwei Wang,Zeming Li,Jian Sun,Jiaya Jia
摘要
-
提出一个简单、强大、高效的全景分割框架——全景 FCN,旨在使用一个统一的全卷积网络表示和预测背景和前景实例;
-
提出内核生成器(kernel generator),将每个对象实例或背景类别编码为特定的内核权重,并且通过对高分辨率特征图进行卷积直接生成预测;通过这种方法可以同时满足前景实例和背景之间相冲突的属性:
- 在全景分割中,可数和不可数的实例被分为 thing 和 stuff,代表着前景实例和背景。为了区分各种 id,thing 通常依赖于实例感知(instance-aware)特征,这些特征是随对象而异;
- 而对于 staff,其更偏好于语义一致性(semantically consistent),这保证具有相同语义信息的像素预测相同。
个体因内在差异而不同,而背景却因内在一致而相似,以往的工作很难同时提取这两种信息。
-
相较于之前工作拥有更高的效率和性能。
Panoptic FCN
Panoptic FCN 在概念上十分简单:
- 引入核生成器(kernel generator) 为不同类别的 thing 和 stuff 生成核权重;
- 核融合(kernel fusion)将不同 stage 具有相同 identity 的核权重融合起来;
- 使用特征编码器(feature encoder)编码高分辨率特征。
kernel generator
给定 表示 FPN 第 个 stage 的输出, 表示核权重, 分别表示 thing 和 stuff 的位置。
Position Head 用于实例定位和分类;kernel Head 用于生成权重。
Position Head
对于输入 ,简单的堆叠卷积层对特征图进行编码得到 ,之后需要对其中每个实例进行定位和分类。
不同于以往的工作,这里将具有**相同语义信息的背景也视作一个实例,**其对应的映射 和