Machine Learning

文章的部分内容被密码保护： --- DON'T MODIFY THIS LINE --- LINK1 深度学习部分 DenseNet 任意的两层之间都存在直接的链接，每一层的输入都是前面的所有层的输出的并集，而该层学习的特征图也会是后面所有层的输入，DenseBlock中需要Feature_map保持一致； Block与Block之间的降采样则使用transition layer，使用BN，1*1的 conv，Pooling来降维优缺点：省参数，省计算抗过拟合，泛化能力强需要保存Feature占显存 EfficientNet 针对卷积神经网络的模型拓展，可以通过：1 增加网络规模可以、增加模型宽度，增加模型深度，增加输入图像的分辨率，但是如何去人工调整这个比例和参数，比较麻烦，实验发现ConvNet缩放过程中平衡网络宽度、深度、和分辨率的维度是很重要的 EfficientNet就是对这些的合理组合，复合型的模型扩展技术集合神经结构搜索技术获得关键技术复合扩张技术所以本文提出了复合扩张方法，这也是文章核心的地方， $$ \alpha,\beta,\gamma $$ 是我们需要求解的一组参数，如下图公式，带约束的最优参数求解。 $$ \alpha,\beta,\gamma $$ 分别衡量着depth, width和 resolution的比重，其中 $$ \beta,\gamma $$ 在约束上会有平方，是因为如果增加宽度或分辨率两倍，其计算量是增加四倍，但是增加深度两倍，其计算量只会增加两倍。 ...