Dropout1.dropout的过程: - 首先随机(临时)删掉网络中一半的隐藏神经元,输...
平均池化和最大池化的区别和使用场景
1.平均池化:AdaptiveAvgPool2d,主要用于:当map中的信息都应该有所贡献的时候,例如图像分...
Group Convolution组卷积的解析
1.知乎上的回答:group 是相对于上一层的 channel 来说的。假如 group_size = N,...
L1正则化和L2正则化的解读
1.Regularization(正则化) 不是 normalization(规范化),正则化解决的问题是防...