公司新闻 您当前的位置:首页 > 新闻资讯 > 公司新闻

百度的CVPR 2020高光时刻:22篇论大鱼直播官方下载文8项冠军2场Work

作者:admin  来源:本站  发布时间:2023-10-03  浏览:48

  百度不仅通过多种形式深度参与 CVPR 2020,也积极为推动行业技术发展做贡献。在全球经济发展重心逐渐偏移智能经济,中国聚焦 AI「新基建」时,百度已准备充分。

  在 CVPR 2020 上,百度正在依托包括百度大脑、飞桨等新型 AI 技术基础设施,获得不俗成绩;此后也将秉持开源、共赢原则,为中国 AI 行业输出「车轮」,推动 AI「新基建」发展。接下来回到 AI 竞赛的试炼场,看看百度的 AI「基本功」。

  CVPR 2020覆盖计算机视觉众多热门子领域,其中,百度参与并夺冠多个领域的挑战赛:

  ActivityNet 挑战赛是视频理解领域最具影响力赛事,其中的时序动作定位赛道(弱监督)(HACS temporal action localization —Track2: weakly supervised)主要考验参赛者能否通过弱标签、弱监督方式有效提升现有视频动作检测算法的效率。百度最终击败其余参赛队伍,以 mAP39.29 的得分位居第一。

  这项比赛中,百度通过自研 BMN 模型对视频序列提取候选框,并结合弱标签训练数据,提出级联金字塔注意力网络进行打标签动作,两者结合最终获取片段定位及动作标签。该技术对高效的视频数据使用具有指导意义,可应用于视频 Highlight 检测、精彩集锦等多个场景。

  针对比赛中第一人称视频小物体多、相机运动模糊严重等难点,百度提出共生注意力机制和以物体为中心的对齐模块,大幅提升 3D 卷积网络的性能。该方法可在多种视频 Backbone 和输入模态下取得一致的性能提升。

  图像降噪作为计算机视觉热门领域,在视频监控、无人驾驶、移动可穿戴设备、遥感及医学图像分析等领域应用广泛。对于 NTIRE 2020挑战赛的真实图像降噪赛道(Real Image Denoising rawRGB Track),其首要目标是去除或纠正图像上的噪声信息,百度最终以第一的成绩达成目标,夺得冠军。

  针对该项竞赛,百度设计了多跳跃连接的密集残差模块学习不同分辨率下的特征表达,并通过创新性 mosaic-stride 模块提升 rawRGB 的降噪能力,同时使用分布式 SA-NAS 搜索最优的模型结构;其中,SA-NAS 搜索方法是百度首次把 NAS 技术应用于图像降噪领域。

  视频质量映射赛道(Video Quality Mapping—Track1: Supervised)关注于图片视频底层视觉技术的关键问题。这一技术可有效提高视频质量,提升用户观看体验。百度凭借过硬的视觉技术和经验积累,取得了该赛道的冠军成绩。

  针对该赛道的问题,百度通过把现有 EDVR 模型思路与 CNN 网络结构 DenseNet 相结合,利用 DenseNet 提取视频的图片特征,融合 CNN 浅层与深层特征,从而实现更强的表达能力;EDVR 模型则完成了视频帧之间信息交换,对齐帧间信息,实现信息共享与互补。

  在车流统计赛道中,参赛者需要解决车辆遮挡、复杂天气下的视觉差异等问题。百度提出“检测-跟踪-计数”结合的车流统计算法流程,有效解决了检测框丢失和 ID 翻转问题。在车流统计环节,提出基于数据驱动的轨迹匹配分类算法使统计结果更准确。

  百度从运算用时、运算速度等维度均位列第一,夺得该赛道冠军。而这一套算法模型,则离不开百度在城市交通大脑方面的数据积累和洞察,在保定市百度 AI 交管大脑项目中,智慧信控系统有效提升了交通效率的20%-30%。

  异常事件检测赛道主要考验参赛者对交通场景的复杂性、交通流的密集混乱性、天气和车辆大小的多样性以及异常标注数据缺乏等问题的解决能力。此技术可以提前发现潜在的交通风险、提前预警交通管理部门、提升交通风险的处理能力和效率。百度在该赛道表现优异,取得98.5%的 F1 成绩,均方根误差为4.8737,比赛成绩排名第一。

  针对此挑战赛,百度通过模块化的多粒度跟踪方法,将跟踪问题解耦成不同子问题,利用不同模块来处理不同子任务,同时将视频进行正序和逆序分别建模,最后利用一种融合和回溯优化方法,将多个子任务以及正序、逆序的模型进行融合得到最终异常事件的定位结果。

  MOTS (Multi-Object Tracking and Segmentation) 多目标跟踪与实例分割挑战赛由德国慕尼黑大学、德国亚琛工业大学、ETH 联合举办,是多目标跟踪方向的权威竞赛。该挑战赛均是计算机视觉顶会 CVPR 的议程之一,可以直观反映参赛者真实的应用能力。百度最终凭借原创自研的领先技术,拿下 KITTI-MOTS 赛道赛道冠军。

  KITTI-MOTS 赛道是自动驾驶权威数据集 KITTI 中多目标跟踪任务的扩展,也是首个同时提供实例分割以及多目标跟踪标注的公开数据集。在 KITTI-MOTS 竞赛中,百度提出新型方法 PointTrack++,在行人和车辆两个类别中均取得冠军。

  具体而言,PointTrack++包括视频实例分割、掩膜特征提取以及多目标关联跟踪等技术,突破性地把 3D 点云分析融入 2D MOTS 任务之中,首次实现实时在线的 MOTS 算法,并在车辆场景测评指标上领先第二名3个百分点以上,实现 SOTA 结果。

  近年来,AI 国际顶会上的中国声音日益响亮,中国 AI 企业、开发者及高校纷纷在 CVPR 2020 上交出满意答卷。百度作为中国 AI 行业头雁,更是通过举办 AI 国际顶会研讨会,鼓励开发者使用飞桨进行参赛和科研开发,以更主动的姿态深入参与到全球 AI 行业的发展之中,代表中国 AI 行业「最强音」站上国际舞台。

  着眼全球科技竞技,人工智能将成为全新「赛点」,AI「新基建」也成为中国经济发展的关键一环。百度已搭建起以百度大脑、飞桨、智能云等为代表的 AI 平台,将进一步推动智能交通、智慧城市、智慧金融、智慧能源、智慧医疗、工业互联网和智能制造等领域实现产业智能化升级,成为中国乃至全球的 AI 创新者和推动者。返回搜狐,查看更多