我在Y Combinator的某家 AI 初创公司里所学到的
2017-03-25 编辑:
编译丨拓扑社 原野
回顾我的职场生涯,我认为自己是非常幸运的,能够赶得上人工智能这一波科技浪潮。之前,我一直从事着「推荐算法」的研发工作,后来一家「金融科技」(FinTech)聊天机器人平台找到了我;最后,我进入到了硅谷最知名,或者说世界顶级创业孵化器 Y Combinator,为 Bicycle AI 初创公司工作。
在这家公司,我们希望通过将「人工智能」和「人」相结合,给客户提供更加优秀的人工智能服务。
这几个月在 Y Combinator 孵化器里的所见所闻让我受益匪浅,我在 AI 和聊天机器人领域上学到了很多东西。湾区真的是一个很神奇的地方,聚集了一大票非常优秀的人才,他们会倾囊相授。而接下来,我会跟大家分享一下在一家人工智能初创公司里得到的收获。噢对了,顺便补充一下我的背景,我还学过心理学。
1.如果不是 AI,那么请别叫它 AI。所以到底什么才是 AI 呢?其实就连我们公司内部的人都连这个基本的概念都无法达成共识。我经常听到人们用这样一句话定义 AI:
「AI 是一种机器能够模仿人类智能行为的能力。」
如果我们要以这句定义作为参考就会出很多问题。就说现在医院通过某些科学技术,能够在人的肺部提前发现潜在的,具有癌变可能的细胞,这应该不是在模仿人类的智能行为吧?
再比如,理解客户的问题,再通过超大海量的数据中提取出来准确的答案,这种 AI 同样不是在模仿人类智能行为啊?事实上,它的能力完全超脱出了人脑力的范畴,这符合上面的定义吗?
尽管我们现在离「人工衍生智能(AGI)」以及「技术奇点」还很远,但我们现在利用 AI 所能做到的事,却已经让我们自己都吃惊不已了。
不可否认,现在「人工智能」已经成为了科技界最为时髦的词汇。在今年召开的 CES 大会上,我们可以看到 AI 这个词出现在各种你所能想象得到的电子设备上,从牙刷到洗衣机无所不包。但是,请不要这么滥用 AI 概念。
如果你是一名投资人,或者是一名想要引入人工智能技术的创业者,除了要把那些戴着 AI 帽子的冒牌货剔除出视野之外,我也不推荐你去使用那种面向大众,一个解决方案匹配无数应用情景的服务,就比如说第三方算法(NLP 引擎),云平台上的 API。
你要去寻找某些开源的,具有替代性质的解决方案,将它们加以变通,测试,使得它们能够更加精准满足你自身的用户使用诉求。
为什么我认为对于创业者来说,目前市面上现成的解决方案并不是理想的选择?
首先第一点:它们那种「以一对多」的特点,决定了它们的短板。一个基于你自身的诉求而加以改良,具有专属意味的技术解决方案,其带来的效果将远远胜过它们。来说说我们自身的例子吧。
我们一开始是用 IBM 的 Watson 作为技术平台,但是很快就转而去开发我们自己的解决方案,我们不停地去测试它们,一旦发现效果比之前的理想,立刻就转面转投到这个方向上。市面上现有的解决方案很多都是免费的,或者是处在充分竞争市场中,价格特别得低,这固然挺吸引人的,但是你要知道它们想要的是什么,它们想要的是数据,你的数据。我想说的是,一开始你使用第三方服务,这没什么,但是要很快地去开发自己的技术来将其取而代之。如果你的团队没有这个研发实力,那么就聘请有这方面实力的技术人才,而且动作要快!
另外,如果你现在就想在 AI 领域开创属于自己的事业,我建议你先去了解一下 Y Combinator 的这篇文章《五个问题,确定你目前所开发的产品是否属于 AI 领域》。这样风投合伙人如果问起你相关问题,你就心里有数了。我向你打保票,他们一定会问的。这五个问题我摘出来,放到了下面,作为你识别、筛选人工智能技术公司的参考和标准:
(1) 这家公司是否能针对你来做一次独立的项目演示?
为了避免有人在云端篡改你的数据,你要要求对方进行一次独立的演示,确保是真正有实际软件在处理你的数据。如果这家公司只能在云端处理数据,你必须再做很多评估工作,确保能处理这么海量数据的产品是可靠的。
(2) 你是否能使用你自己的数据?
当公司在演示的时候只是使用它自己的数据,那么整个系统运行得特别好。但这并不意味着把你的数据换上来,系统同样不负众人期待。我的建议是:用你的数据来实时测试系统,保证它在实际情境中的效果如演示中一样。
(3) 他们的数据源是什么?数据规模有多大?
如果没有大数据,AI 就无从谈起,正如人如果没有空气就无法生存一样。为了确保研发工作是有效的,应该提供的是真实可靠,真正意义上的大数据。而公司必须提供数据的规模、来源,大数据所具备着怎样的能力。尤其是要明确数据的来源。
一般性的数据来源:比如股价历史记录,政府数据,或者某些开源的项目。
(4) 算法的细节是怎样的?
要多问公司一些算法的事,尤其是要了解它的细节内容,就比如说在这个产品中,神经网络的功能循环到底是怎样的。技术方法并不是什么商业秘密,所以公司是会愿意谈起的。如果他们闭口不谈,那么你就应该有所戒心了。
(5) 他们是否已经有了一些客户?
如果已经有人用了这款产品,跟他们去好好聊聊。就比如说数字安全领域,其实存在着两种模式:「阻拦模式」和「监控模式」,这两者之间是存在着巨大差异的,只有「阻拦模式」才能有效地降低「错误事件」出现的概率。
换句话说,你需要找到的那些客户,他们本身的诉求应该和你高度一致。
2. 如果不是 AI 所擅长的领域,请别把 AI 拉扯进来。AI 的概念现在真的是红得发紫。但是,只有解决实际问题的,真正意义上的 AI 公司才能长久生存下来,其他的公司只是跟风,拿了风投,把钱烧个精光,到头来辜负了风投的信任。
也许在你的领域里有着最优秀的算法,但是如果你没有找到一个合适的方式来应用它,从而有效解决一个实际的问题,那么一切都无从谈起。真正好的人工智能技术必须依托在现实性强的应用方式上。就比如说 Google Photos,它使用了 Cloud Vision API 才达到如此出众的效果,但是你不知道它之前走了多少的弯路。