计算机教学论文(计算机视觉精选论文)
计算机教学论文(计算机视觉精选论文)
2019 年转眼已经接近尾声,我们看到,这一年计算机视觉(CV)领域又诞生了大量出色的论文,提出了许多新颖的架构和方法,进一步提高了视觉系统的感知和生成能力。因此,我们精选了 2019 年十大 CV 研究论文,帮你了解该领域的最新趋势。
我们看到,近年来,计算机视觉(CV)系统已经逐渐成功地应用在医疗保健,安防,运输,零售,银行,农业等领域,也正在逐渐改变整个行业的面貌。
而今年,CV 领域依然硕果累累,诞生了多篇优秀论文。我们选择了其中十篇论文,以供大家参考、学习,了解该领域的最新趋势与前沿技术。
这十篇论文涵盖了卷积网络的优化,计算机视觉中的无监督学习,图像生成和机器生成图像的评估,视觉语言导航,使用自然语言为两个图像标注变化等。
以下是我们精选的 10 篇论文目录,先一睹为快:
1.EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks
EfficientNet:卷积神经网络模型缩放的反思
2.Learning the Depths of Moving PeoplebyWatching Frozen People
通过观看静止的人来学习移动的人的深度
3.Reinforced Cross-Modal Matching and Self-Supervised Imitation Learning for Vision-Language Navigation
增强的跨模态匹配和自我监督的模仿学习,用于视觉语言导航
4.A Theory of Fermat Paths for Non-Line-of-Sight Shape Reconstruction
非视线形状重构的费马路径理论
5.Reasoning-RCNN: Unifying Adaptive Global Reasoning into Large-scale Object Detection
Reasoning-RCNN:将自适应全局推理统一到大规模目标检测中
6.Fixing the Train-Test Resolution Discrepancy
修复训练测试分辨率差异
7.SinGAN: Learning a Generative Model from a Single Natural Image
SinGAN:从单个自然图像中学习生成模型
8.Local Aggregation for Unsupervised Learning of Visual Embeddings
视觉聚合的无监督学习的局部聚合
9.Robust Change Captioning
强大的更改字幕
10.HYPE: A Benchmark for Human eYe Perceptual Evaluation of Generative Models
HYPE:人类对生成模型的 eYe 感知评估的基准
接下来,我们将从核心思想、关键成就、未来技术应用等方面,详细介绍这 10 篇论文。限于篇幅,我们将解读分为上、中、下三个篇章,欢迎大家持续关注后续内容推送。
1
《EfficientNet:卷积神经网络模型缩放的反思》
论文地址:https://arxiv.org/pdf/1905.11946.pdf
摘要
卷积神经网络(ConvNets)通常是在固定资源预算下开发的,如果有更多资源可用,则会进行扩展以获得更高的精度。在本文中,我们系统地研究了模型缩放,并发现仔细平衡网络的深度,宽度和分辨率,可以带来更好的性能。基于此观察结果,我们提出了一种新的缩放方法,该方法使用简单而高效的复合系数来均匀缩放深度/宽度/分辨率的所有维度。我们证明了此方法在扩展 MobileNets 和 ResNet 方面的有效性。
更进一步,我们使用神经体系结构搜索来设计一个新的基准网络,并对其进行扩展以获得称为 EfficientNets 的模型系列,该模型系列比以前的 ConvNets 具有更高的准确性和效率。特别是,我们的 EfficientNet-B7 在 ImageNet 上达到了最先进的 84.4%top-1 / 97.1%top-5 精度,同时比现有最佳 ConvNet 缩小了 8.4 倍,推理速度提高了 6.1 倍。我们的 EfficientNets 还可以很好地传输并在 CIFAR-100(91.7%),Flowers(98.8%)和其他 3 个传输学习数据集上达到最先进的精度,而参数要少几个数量级。源代码链接:https://github.com
/tensorflow/tpu/tree/master/models/official/efficientnet.。