首页 > 社会焦点 > 正文

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

2017-03-28 编辑:

  【重要通知】【倒计时 1 天,点击“阅读原文”获取参会指南】新智元和行业领袖英特尔联合举办中国AI 2017 开年盛典启幕在即。新智元327技术峰会暨颁奖盛典现场一律凭活动行二维码入场大会于3278:00 正式开始签到,8:50会议开始现场座位紧张请提前签到换领大会嘉宾胸卡。大会将在腾讯科技、云栖社区和爱奇艺上同步直播欢迎关注。

  腾讯科技直播地址

  阿里云栖社区直播地址

  爱奇艺直播地址

  【新智元导读】备受关注的计算机视觉国际大赛——ImageNet 大规模图像识别挑战赛(ILSVRC2017)已经拉开帷幕,今年的比赛分为四个主要项目:定位、识别以及视频中物体识别和Tester Challenges。去年在比赛中拿下场景分类关键的海康威视首席专家浦世亮近日接受新智元专访,他谈到了去年参赛详情和技术细节。他也对深度学习与安防行业现状的10个问题进行了深入解读。

  根据 ImageNet官网的最新消息,今年的 ImageNet 大规模图像识别挑战赛(ILSVRC2017)已经拉开帷幕。

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

  今年的比赛项目分为4个:

物体定位

物体识别

视频中物体识别

Tester Challenges

  官网特别提示:已经使用了几种算法的参与者可以每个算法提交一个结果(最多5个算法)。算法参数的变化不构成不同的算法(遵循PASCAL VOC中使用的过程)。

  去年的 ImageNet上,来自中国的团队大放异彩:CUImage(商汤和港中文),Trimps-Soushen(公安部三所),CUvideo(商汤和港中文),HikVision(海康威视),SenseCUSceneParsing(商汤和港中文),NUIST(南京信息工程大学)分别拿下多个项目的冠军。

  其中,海康威视拿下了场景分类(Scene Classification)的冠军。具体赛果见下表:

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

  另外,在物体探测任务上,海康威视也有亮眼表现:

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

  海康威视这家做安防出身的企业目前在计算机视觉上已在国际上取得领先的地位,除了ImageNet 外,在PASCAL、KITTI和MOT等竞赛中都有亮眼表现。

  根据海康威视首席专家浦世亮介绍,在PASCAL VOC2012目标检测上,海康威视基于Faster R-CNN深度学习目标检测算法mAP性能达到87.9,排名第一,领先盘踞榜首近一年的第二名微软4.1个点,刷新纪录。

  新智元最新一期的AI领军人物专访采访到了海康威视首席专家、研究院院长浦世亮,他分享了海康威视夺冠 ImageNet 背后的技术,谈到 2017年,深度学习在复杂网络设计、模型压缩方向的研究依然是热点,深度学习和LSTM、增强学习的结合进一步加强。另外,针对当下安防行业的智能+现状,他也提出了独特的见解。

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

浦世亮 海康威视研究院院长

  浦世亮,法国国家科学研究院(CNRS)博士,浙江大学理学博士,现任海康威视首席专家、研究院院长,负责公司在人工智能及大数据领域的技术研究。浦世亮带领研究院研发的Smart 265编码技术、目标结构化算法、车牌识别算法、人脸识别算法、视频检索引擎、多传感器融合等技术,被广泛应用于公共安全、金融、交通、司法、零售、智慧城市等多个领域。

  【预告】明天的新智元“327”技术峰会上,浦世亮将作为特邀嘉宾分享题为《安防大数据驱动下的智慧生活》的演讲,就(1)智能设备面临的现实问题;(2)对物理世界更真实的描述;(3)如何应对物理世界的挑战;(4)从安防大数据开始的展望等话题展开。更多精彩,请关注大会直播。

  以下是专访内容:

  海康威视 ImageNet 2016 夺冠背后技术详解

  新智元:去年 ImageNet 大规模图像识别挑战赛(ILSVRC)中,海康威视(HikVision)拿下场景分类项目的冠军。你能具体介绍一下这一比赛项目吗?海康威视夺冠的技术核心是什么?

  浦世亮:ImageNet 场景分类任务采用MIT发布的 Place2 数据集,其目的是对图像中存在的场景进行识别。该数据集拥有365个类别的场景目标,800多万张已经标记的训练样本。相对于普通的ImageNet图像分类任务,场景分类任务的难点在于其数据分布非常不均衡,每个类别的数据从5000 到 30000不等,每张图像都可能在不同的场景描述和相对更模糊的场景标签。

  场景分类技术,对于视频产业及其应用领域有比较重要的应用价值,基于对场景的理解有助于我们的系统更好地对于视频中的信息进行理解和应用。

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

  海康威视从成立之初就专注于计算机视觉领域技术的研发,13年就开始深度学习的技术布局,实现了一整套的深度学习训练框架,并探索了深度神经网络的优化算法,包括对网络参数初始化、超参数搜索、正则项、损失函数、流形优化理论等的研究。

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

  另外,我们还从信号调制方向切入,围绕信号在网络前向反向传输中的保范性(norm-preserving),探索深层网络优化的可行性与新方向。

  浦世亮:深度学习+安防 10 问

  

ImageNet 2017启幕,海康威视浦世亮谈2016夺冠绝技及深度学习+安防?| 新智元AI 领军人物专访

2016年10月24日,海康威视在北京召开“AI+:感知未来、融合发展”主题论坛,新智元受邀出席。


大家都爱看
查看更多热点新闻