计算机视觉领域的前景与挑战-数据增强

04/15/2021

计算机视觉在利用数据增强的技术强化下能够大规模提高模型的准确率。—Google Brain科学家Ekin Dogus Cubuk

数据增强技术的多样性提高准确性

Google Brain科学家Ekin Dogus Cubuk做了一个有趣的演讲，重点介绍了深度学习中一个有待充分利用的工具——数据增强。虽然数据增强技术，如混合、剪切和几何运算，在今天已经得到广泛的应用，但Dogus假设，这些技术的正确组合可能会提高某些计算机视觉项目的准确性。当他的团队对这个理论进行测试时，他们确定了一些基本的数据增强实践，其中一个重要的实践是“数据增强策略的多样性”。与其对每张图片和每一个小批量图片集应用一种策略，不如使用数百种策略并为每张图片随机选择一个策略，实际上后者能极大地提高准确性。展望未来，Dogus表示，他们希望将数据增强成果应用于除影像分类外的其他领域，包括视频和目标检测。

医学计算机视觉项目的数据增强

来自麻省理工学院研究生Amy Zhao， Zhao的论文《利用学习变换进行一次医学图像分割的数据增强》解决了数据科学家在将深度学习技术应用于医学数据时所面临的一些难题。这项工作探讨了只有一个标注的示例（一种常见场景）情况下的分段策略。Zhao认识到，为达到医疗应用所需的准确性水平，目前需要经常手动标注（或至少微调）数据集。但她乐观地认为，有可能通过训练机器学习模型，模拟大脑磁共振成像等图像的复杂变化。为此，她提出一种方法，即使用未标记的数据集（广泛用于核磁共振成像）作为示例，用来训练分割卷积神经网络（CNN），以利用深度学习的能力。

AdaGraph：利用图统一预测域和连续域自适应

Zhenpei Yang领导的Facebook团队所撰写的论文题为“通过场景完成进行RGB-D扫描的极端相对姿态估计”。本文旨在解决计算机视觉、机器人学和计算机图形学中的一个基本问题：估计同一基本环境中两次RGB-D扫描之间的相对刚性姿态。

谷歌研究人员正致力于研究应用于机器感知各个领域的机器学习技术。他们的团队还展示了若干近期工作，包括预测行人运动背后的技术、Open Images V5 数据集等等。

澳鹏支持计算机视觉与数据标注

许多机器学习项目没有大量时间尝试各种机器学习算法和策略，它们需要比竞争对手抢先一步将产品或服务推向市场！为了获得更为准确的结果，澳鹏提供一系列图像标注服务。澳鹏可以处理多阶段标注，方法是将逻辑树和依赖树构建为多轮（不受限制的）标注，更详细地审查图像，并构建针对每个对象的特定元数据。我们还能审查图像中的攻击性内容，在客户端的图像识别软件中对图像进行标注，以改进搜索功能，并按质量对图像进行分类，以随时间改进搜索内容。

澳鹏支持数据增强模式识别

澳鹏提供数据增强服务，以确保您拥有计算机视觉项目（如图像或视频标注）的优质训练数据。澳鹏解决方案具有若干重要流程组件，将有助于确保尽可能提高数据质量：

数据分组/分布分析与可视化

数据异常检测

数据偏差消除策略

数据自动增强策略

数据标注服务建议

通过全面、易于实现的数据标注和项目管理服务，澳鹏提供端到端的解决方案，可以快速提供您所需要的基础条件，使您的计算机视觉解决方案尽可能准确。

澳鹏提供计算机视觉AI所需的全生命流程数据服务，包括数据采集、数据标注、数据集以及模型测试，为您部署更好的计算机视觉AI进行数据支持。

联系我们