首页 > 社会焦点 > 正文

翊翎资本范维肖:想投资人工智能?这些需要知道

2017-05-12 编辑:

  本文系根据健一会(ID:jianyihui2011)沙龙第181位主讲人范维肖CC(翊翎资本合伙人)在人工智能沙龙上的精彩分享整理而成。根据嘉宾意见,分享内容已删去部分敏感观点及内部信息。

  ■ 文/范维肖CC(翊翎资本合伙人)

  我们基金的名字叫翊翎资本,从2016年2月开始,翊翎资本着手在人工智能领域进行布局。

  以下是我个人在人工智能投资过程中的一些心得。

  算法、数据、算力:人工智能的“三驾马车”

  追根溯源,数据是人工智能的基础。

  早期,人类经历了数据的采集、清洗、标记、存储、计算,经历了大数据的代际。通过数据,人类知晓过去发生什么,还知晓发生的原因。

  借助于人工智能对数据的增力作用,人类又知晓未来发生了什么,还能对未来做自动优化。

  从最早的“基础+激活”到“分析+人工决策”,未来的自动决策、自动控制是个更重要的过程。看待整个人工智能发展史,现在是非常重要的时间点,要清醒地识别一个边界,判断其属于过去还是未来。我们应该在这个边界线的附近寻找更多机会。

  人工智能有三个支撑基础:算法、数据和算力。算法是核心。

  我们见过很多所谓的黑科技。为什么叫黑科技?因为它跟当下保持一定距离。黑科技如果距离当下过远,往往可能是跨过了科技树的发展过程,跟产业没有融合,就会产生大问题,比如说不能产生有效数据,不能进行有效判断。

  数据用来训练算法,我们通常把这个过程叫“喂数据”,把数据叫“奶妈”。没有数据,再好的算法也很难进行有效升级。在过去几年中,我们特别幸福地经历了大数据时代。现在的特征是,各个行业大量数据沉淀积累,数据开始与科技产生碰撞。过去我们不遗余力、不择手段地去获取数据,而在数据红利期,数据极大丰富,精度提高,这也是大数据时代留给我们的一个最好的基础。

  目前的算力是基于GPU的计算效率。与传统CPU时代相比,GPU有了大幅提升,以前算一个东西需要2-3年,迭代效率太低,GPU出现之后,像亚马逊便开始提供硬件工厂,让大家通过租用方式去构建集群,节省了人力和硬件成本。算力提速,AI的产出就刺激很多商业领域进行革新,这些革新反过来又驱动数据和算法的持续提升。

  算法、数据、算力相互促进,它们所带来的红利现在来看还是不明显。2016年Facebook、Google一起将这些东西以开源方式奉献给社会,降低了AI行业的进入门槛。

  如何寻找人工智能产业链的投资逻辑

  如何投人工智能项目?我们总结出了一个棱镜法则。

  棱镜法则涉及到光的色散原理。透过一个形状为等边三角形的玻璃棱镜,白色的光从左侧照进来,通过两次折射产生光谱。这个折射过程很好地透视了我们翊翎资本的一种投资逻辑,有助于我们较为容易地剥开算法、科学、技术、产品的外衣,看到人工智能产业链的投资逻辑。

  从春运看碎片化数据的价值

  人工智能发挥价值过程中的第一个推进器叫数据增益。

  人工智能仅用于有数据的行业。这个行业积累的数据是否全?精度是否够高?是否愿意拿出来被用?这几点是决定着我们判断人工智能产品能否有效果的第一个推进器。

  现在是一个大数据极大丰富的年代,“极大丰富”说的不是量,而是指利用率,这是数据本身的核心之一。很多业务场景都是基于现有数据去构建上游业务场景,业务场景引来新数据的产生。

  我们发现,数据孤岛化和碎片化的情况越来越严重,一家大厂商去融合各种各样数据的可能性太低。我有数据,不会给别人;数据越多,我越不会给别人。

  数据碎片化过程中有很多机会,也有很多商业领域的正向循环,这是我们最为关注的。能否在我们所投的大数据公司乃至整个数据产业链条里找到现有数据对于AI技术有增益的方向,这个对我们来说很重要。

  翊翎资本范维肖:想投资人工智能?这些需要知道

  用大数据展示春运迁徙路线。图片来自百度。

  举个例子。

  春运是全国性大难题,春运本身逻辑不在于我们怎么去优化运输环节,春运的本质问题是运力不足,解决这个问题需要修建更多轨道、投放更多火车,但在非繁忙闲置时间,这些投入造成的浪费究竟有多大?

  还有个问题是,春运系统越优化,春运就越拥堵。为什么?大家24小时不停地往回赶,每个人都想回家,这些底层的诉求都不会因为技术和数据的变化而变化,这是问题的核心逻辑。

  所以有时候,那些所谓“极大丰富”的客流数据在春运领域里作用真不大。但这些数据放到地方是有用的。诸如山东这样的省份,一个城市里高达11.7%的人口都在外地务工,为了应对这些人在春节集中返乡,这些地区水电使用量等数据的早期预测很重要。也就是说,春运数据用在其他领域反而是合适的。

  但春运数据怎么公开?这个事就变得非常非常折腾,理论上是公开不了的,特别是关系到隐私问题。

  现在中国数据开放程度在全球排名很靠后,排到八九十位,美国排在第八位。数据的开放程度与对人权及对个人的隐私的尊重成正比。只有保护隐私才能够去开放。这一点从侧面说明了数据碎片化一定会越来越加重。

  场景增益要做顶层机构调整

  第二个推进器叫场景增益。

  移动互联网领域有着严重的To C逻辑,而To C消费类互联网服务讲究沉浸感,大家绞尽脑汁为了增强用户体验而完善产品,比如帮助用户查询时间缩减一秒,帮助用户在使用APP时少翻页、少点击,获取更准确结果。这些都是产品的提升。但AI正处于婴儿阶段,现在就进入商业环境,对场景的增益有多强?这个问题值得认真思考。

  场景增益决定光谱的价值。

  还有一个需要理解的场景叫马赛克。我们用一个比较污的话题来讲这件事儿。

  现在有很多人在做图片鉴黄,一个国家部门找我们咨询,说有人在做图片鉴黄,识别率是98%,这种技术该花多少钱去买?合不合适?

  翊翎资本范维肖:想投资人工智能?这些需要知道

  利用人工智能的深度学习技术来鉴黄。图片来自投资界。

  98%是什么概念?是给你100张色情图片,有两张检测不出来。假如说新华网用这样的技术,它一定要保证它的网站内容绝对不会出现任何差错。所以98%的识别率在这种场景下没有用。

  反过来,另一家小公司也做图片鉴黄,给它100张图片,能识别出3张来,保证这3张图片100%一定是黄色图片,人工只需要鉴定其余的97张就好了。

  场景落地的时候,企业端看的是投入产出比。我投入极低价格,帮我解决一部分价值,对我来讲就是个极大效益。

  所以到了场景增益的时候,我们要做的是顶层结构的调整,这个顶层结构的调整从两边来讲,一边是做AI的公司,一边是应用AI的公司。

  早期AI公司都是To B的增益,我们一定要去理解产业上的一些问题,知道产业症结在哪儿,进去之后能够对这件事有极大增益作用,我才能去拿到数据,持续在上面做学习和改进。


大家都爱看
查看更多热点新闻