Deep learning 其实包括两部分,第一部分是线下的训练,在云端或者加载GPU 的服务器端做训练;另一部分是做线上的推理。在线下训练,之后将训练好的模型放到线上去做推理,这是目前 deep learning 较为普适的模式。
Deep learning 的模式较为适合三类数据,computer vision 数据,语音数据,自然语言处理数据。这张PPT展现从 GPU 到 SDK 到 framework 到上层的应用。GPU带来的 deep learning 创造了全新的计算时代,也给初创公司带来很多机会。
AI的机会很多,在单一技术和组合式产品中,都有良好的市场。
我们可以从初创公司中看 deep learning 中有哪些机会:1)健康医疗,比如皮肤癌的研究在用 deep learning 做;2)零售,主要解决商品选择和支付问题。Focal 公司解决如何让传统零售业爆发活力的方案,核心技术是对物体的识别。客户进入实体店后,有类似于pad 的装置,用手推车进行购物,当挑选完商品后,不用结账,自动识别。同时,当商品从货架取下后,系统会自动补货。这个公司主要面向零售业的细分市场;3)金融。美国有一家投资公司,用了无人机和卫星图片,天天在美国上空扫庄稼地,利用 DNN 网络做图片识别,看看某几类庄稼的长势如何,并在期货交易所做对冲。可以通过历史数据比对,看是欠收还是多收;4)安全;5)IoT,比如机器人、无人机公司。目前有陪伴机器人,服务机器人,用无人机撒农药,这些都是针对特殊场景的很好的应用;6)无人驾驶,代表了 deep learning 技术与未来交通行业的结合;7)网络安全。有些公司用 deep learning 做对于病毒、恶意模式的判断,这些方案能够实时升级,判断新来的病毒属于哪一类。因此,AI的机会很多,在单一技术和组合式产品中,都有良好的市场。
与大家分享一下一些 AI 的典型应用。第一个应用是在车里用语音与车进行交互;第二个应用是基于图像的物体识别,能够在图片库中找到心仪的物品。在数据库领域,这种基于图片的应用也很有意思。比如 SAP 在训练 DNN中,将广告中公司的图标抓取出来,并给客户一个报告,在这段视频中,图标出现多少次,出现在什么位置,并判断投资和品牌曝光度是否合理。这一特性,给SAP带来很好的客户反馈;第三个应用是基于用户行为作出判断,比如喜欢什么类型的电影。
我们与祖母可能交流困难,如何应用 NLP 技术与她进行交流,增强人与人之间的沟通;第二张图片与医疗相关;第三张图片中是微软的工程师,是一个天生的盲人,微软现在有一种眼镜能够进行物体识别,这也是基于deep learning很好的应用。
第一张图是我们在平安城市中抓取特征点;第二张图是服务型机器人;第三张图是在农业方面的应用。因此,在 AI月 deep learning 的时代,有很多领域大家可以尝试去做。
这张图想与大家分享一下英伟达在自动驾驶领域的应用。我们将自动驾驶变为AI 的任务,模拟人进行驾驶。当人驾驶时,人需要知道周围环境,车的位置,并作出相应的驾驶策略,这也是AI的任务。1)感知:我们会用多样的传感器将周围环境情况了解清楚;2)reasoning:判断周围环境是否安全;3)驾驶:依托于高精度地图,高精度地图能够提供丰富的环境信息和精确的定位。
这是一个总结,可以看到人工智能时代在架构、软硬件、算法等方面不断向前发展。
GTC 新产品解读
下面我会跟大家分享一下,在 GTC 2017 中一些比较好的收获。
第一个就是,英伟达在 GTC上宣布了新一代的 GPU,VOLTA100。我们每一代的GPU有一个科学家的名字,这一代的GPU 对我们来说,有几方面的提高,第一是它有 210 亿个晶体管,12纳米线程,然后整个核心板的面积在815毫米平方,这是一个非常大的进步,整个架构上有一个非常大的进步。
这一代,我们的架构有一个很好的一个提升,我们会在这一代架构里面放入一个Tensor 核,它完成了以前矩阵式同步这种的矩阵式相乘,实现非常高速的运转。这样的结果会让我们产生120Teraflops 的计算能力,这种计算能力无论针对 Training 端还是 Inference 端都是非常好的进步。这一代产品是英伟达最新在 GTC上发布的。
这一页是跟大家讲一个蛮有意思的产品,其实机器人或者说我们叫智能体的这种产品已经出了挺长时间,但是机器人这种产品有一个问题,就是说机器人这种场景,你真正去训练它的时候,其实是挺困难的,包括有各种场景你要去模拟,这是比较大的困难,因为第一个是时间长,第二个你不会去造很多机器人一块去学一些东西,这样的话,你这个研发包括这种开发的周期会很长。
这是我们叫 ISAAC 的 SIMULATOR,其实是把深度学习和模拟结合在一起,它其实是用一个模拟的平台去训练机器人,比如说我训练一个机器人做一个动作,做什么动作呢?我做一个比如说打高尔夫球的动作,那他就去做模拟,他一遍一遍的做,这样的话,如果一个机器人的公司,它以使用这样的模拟器。它去做这种模拟的时候,可以同步去做多个,或者是把一种机器人同步做多个机器人的模拟,然后做多个场景的模拟,甚至是一个场景多个机器人去模拟,这样去做。这样的话,会极大的提升模拟和开发的效率。
转载请注明出处。