社会焦点

AI 平台上有近9亿用户后,科大讯飞的大数据变现生意要怎么做?

字号+ 作者: 来源: 2017-05-09

AI 平台上有近9亿用户后,科大讯飞的大数据变现生意要怎么做?,本科进科大讯飞什么待遇,捷通华声和科大讯飞的差距,精准扶贫大数据平台,安徽科大讯飞公司待遇,pc版讯飞输入法操作演示

  英国科幻小说作家亚瑟·克拉克曾指出,任何科技如若足够先进,就和魔法别无二致。

  《经济学人》今年 1 月发表的封面文章《轻而易 “语” 》回应了亚瑟的观点,作者以迅速发展的语音识别技术举例:对着空气说一句话,附近的智能设备就会帮你得偿所愿。

  这种变化非同小可。机器诞生之初,仅能对纵列数字做简单的加法运算,而现在却可下出一盘好棋、理解简单对话并执行指令。

  在语音识别与大数据的宝藏中,我们还可以挖掘什么?

来源 | 峰瑞资本「 X 实验室」

  文 | 谭昶(科大讯飞大数据研究院副院长)

我是 2015 年加入科大讯飞的,此前曾经创办了一个大数据创业公司,为中国移动等企业做了一些大数据项目。随着业务的开展,我和创业小伙伴们发现做好大数据技术的前提条件是能够接触到真正意义上的大数据,否则就像是一直围绕着大数据这座金山周围的小土丘打转,挖不到真正的金子。恰好这时,讯飞邀请我加入,组建讯飞大数据研究院,从讯飞人工智能开放平台 8.9 亿用户这座金山里挖掘数据价值。

讯飞核心研发部门包括讯飞研究院、云平台研发部、大数据研究院、语音资源部。这几个部门加起来共有 500 人左右,不到讯飞的员工总数 6000 人的十分之一,但是这些部门产出了讯飞几乎所有的科研成果。

通常,核心研发部门相对较为关注如何把技术做到极致,而业务部门则更注重思考技术的落地和应用。我们的工作不仅局限于研发顶尖技术,还包括业务系统研发过程中的技术咨询、方案设计等很接地气的工作。有时为了核心技术的落地应用,我们也会和业务部门一起走到前线,和最终用户沟通需求。同时,核心研发部门也是公司内部资源共享的重要平台,例如公司会把所有部门的数据处理分析任务都放到研发部门的大数据平台 Odeon 上来,整个公司的业务数据都是打通和共享的。

今天,我们重点关注以下几个问题:

语音识别准确率达到 97% 之后,我们计划做什么?

大数据变现的关键要素是什么?

要想实现「红海」突围,大数据企业可以做什么?

  语音识别的下一步

2003 年时,讯飞下定决心,要做中国的原创核心技术企业。那时,大家都认为语音识别不可能赚钱,有谁会对着机器说话呢?正是市场的这种认知,逼着我们尝试把语音技术应用到各个领域去,在各个领域都扎下了一些业务的苗子。例如,我们通过声纹识别和人脸识别的结合来搭建社会保障生存认证系统,又通过语音识别和转写来做讯飞输入法,还做了口语考试的语音评测体系等等。

我们在技术层面取得的突破,得益于 2006 年开始,深度学习技术的迅速发展。在 2008 年至 2010 年间,讯飞最早把这项技术运用到了语音识别领域。 2010 年后,我们又把单纯的语音识别扩展到自然语音理解,并尝试了人机交互、图像识别方面的工作。现在,讯飞的语音识别准确率已经可以达到 97%,并且能够实现实时语音转写和翻译。

回顾过去,我们最初的愿景其实是让机器能听会说,而能听会说的下一步则是理解自然语言。这个标准实际上已经非常接近于要求机器能理解、会思考。语言是人类区别于其他动物的最大特征,到了以 「能理解、会思考」 为目标的阶段,讯飞也自然而然地从语音技术公司转变成了人工智能公司。

不过,虽然我们的核心技术已经应用到了各个领域,我们仍始终认为,让技术转化为实际生产力是一个非常漫长的过程。即便技术登峰造极,产品如果不接地气,市场仍然不会去买单。即使技术走到了 90% 或 99% 那一步,如果还没有得到市场的认可,我们也只是刚刚起步。

AI 平台上有近9亿用户后,科大讯飞的大数据变现生意要怎么做?

  大数据的变现通路

讯飞基于自有大数据或者合作伙伴的大数据,重点在精准营销、个性化学习、智慧城市三个方向做了应用落地和技术研发。

精准营销

在精准营销领域,讯飞最大的优势是有自己独一无二的大数据来源。讯飞的人工智能开放平台向所有有兴趣做人工智能应用的合作伙伴开放人工智能能力,同时通过这些合作伙伴手机到了大量的用户行为数据。讯飞现在有 20 万家合作伙伴,领域从手机输入法、手机语音助手,到导航 App 里林志玲、郭德纲的语音,还有购物 App 里的语音搜索,讯飞已经构建起一个人工智能和语音服务的生态圈。

例如,目前市面上能够买到的和人对话的机器人、儿童玩具或手机 App,80% 以上都使用了讯飞的人工智能云服务。目前平台上有 8.9 亿独立用户,包括讯飞输入法的 3.6 亿用户,每天产生 30 亿次交互。因此讯飞也建设了大数据能力平台 Odeon ,用来存储、处理这些大数据。Odeon 自 2010 年上线以来,目前集群已有 400 余台,日均新增数据达到 100TB。这是讯飞自有大数据宝藏的最主要源泉。

以平台上的大数据为基础,我们综合运用人工智能和大数据技术,从人生阶段、行业、购物偏好、媒介偏好等维度,用 1700 个子标签对这些用户作出区分。例如,声纹识别技术对用户的性别划分、年龄划分很有帮助,如果仅靠传统的用户行为数据或日志数据,我们是没有办法得到这些精准结论的。

用户画像完成后,第一件可以做的事情就是精准营销。精准营销的核心价值在于对用户的分析、挖掘以及引导,而导流的最终体现则是用户对广告的点击。这已是一条比较成熟的数据变现路径。

在广告形式上,讯飞也做了一些创新探索。例如交互式广告,用户对着手机喊出相应的品牌,即可赢得一些奖励。现在,我们不仅对内部的讯飞广告平台提供服务,也对有精准营销需求的第三方提供数据交换和查询服务。这项业务每年可以做到数亿流水。

另一部分精准营销的工作内容围绕推荐付费内容展开,包括推荐付费音乐、铃声、阅读和一些视频内容。根据个性化推荐算法,我们把不同的付费内容匹配给不同用户,再进行一些商业化运作。

个性化学习

在教育领域,「因材施教」 的道理听上去很简单,但背后需要非常复杂的脑力劳动来支撑。老师需要知道学生擅长什么,什么相对而言比较薄弱,了解程度需要具体到知识点层面,比如,某位同学擅长一元二次方程,但平面几何稍差一些,题目设置的难度和学生需要投入的精力,在这些知识点间都要有所不同。

通常,老师了解学生学习情况的方式是上课提问,或者看作业错题和考试成绩。如果用机器来完成这一步,就需要让机器也能够 能看会写、能听会说。讯飞目前的做法是用高速扫描仪,把学生日常作业、随堂检测、考试答题卡等全部扫描进去,把题目和答案转化成一个个对知识薄弱点的判断数据,再把这些数据集合起来形成教育大数据,有针对性地向学生推荐相应的课程和题目。

这其中,关键的两个步骤分别是:利用人工智能的手段,搜集真正的教育过程数据;把教育过程数据转化成为学生学习过程中有的放矢的针对性辅导。按照中国目前的经济发展水平,我们不可能要求所有学校学生的学习过程全部上网,所以我们提供了上述解决方案——高速扫描手写作业和试卷。

我们组建了一支数十人的团队来完成这部分工作。项目筹备期比较久,直到 2014、2015 年时,我们才在技术层面取得突破。在评阅英语作文、语文作文这一块,我们曾面临很多问题。例如,在英文作文中出现了汉语拼音怎么办?从文字识别到自动评分,这个过程花费了一些时间才得以完成。这两年学生参加四六级考试,作文部分的阅卷工作很可能就是由讯飞的机器来完成的。我们在 2016 年时做过验证,机器阅卷判定的分数,和专家组的打分结果不相上下。

现在,我们和全国百强校中的一半学校签署了战略合作协议,把个性化学习的核心技术打造成讯飞的智学网产品,供全国各地的学生使用。最初讯飞的个性化学习实验在合肥一中开展。实验结果非常好,一个学期的时间,两个实验班同学的数学平均成绩提高了 10%,从全年级二十多个班级中的第 14、15 名,提升到了第 1、2 名。

与此类似的领域还有医疗大数据。这部分业务,我们还处在探索阶段。医疗是一件非常有趣的事情,就像学生学习依赖于有经验的老师来辅导那样,医疗也依赖于有经验的医生的判断。我们通过数据收集、设计人工智能模型,学习有经验的医生的诊断过程,再把诊断过程变得自动化。我们已经取得了一些成果,例如在肺癌检测方面,以前诊断一个病人,一位医生要花费一天的时间看上几百张 CT 片,现在这个过程机器只需要几分钟就可以给出初步结果供医生决策。

智慧城市

加入讯飞后,我的第一个任务就是做智慧城市大数据分析。想让城市的服务变得智慧化需要调用许多大数据,包括交通数据、运营商数据、政府数据、舆情数据等。如何从这些数据中分析出城市的发展状况以及城市内部存在的问题,是我们的核心任务。

其中,在交通领域最基础的工作是跟踪人和车的移动轨迹,研究他们的移动规律。每座城市都可以划分为若干个区域,区域间的人群流动就像城市的血脉。例如,白天人们从 A 区到 B 区上班,晚上人们从 B 区回 A 区居住休息。

从这些移动轨迹中,我们能够分析出人们在哪里住、在哪里工作、去哪里娱乐,能够发现城市的职住比是否平衡,每片区域更应该打造成为商业区、居住区还是工业区。此外,我们还可以据此判断发生拥堵、踩踏事故的几率,并提前 20-40 分钟进行预警。

在判断轨迹的数据来源方面,我们认为,地图导航等 App 的使用频率还是偏低。相较而言,手机运营商的基站产生的数据量更大。城市里,所有人的手机几乎都时刻连接着运营商的基站,不停上报自己的位置。

不过,运营商基站接收到的信号范围半径在 1000-2000 米左右,没有办法精确到城市规划所需的 100 米的范围内。我们为此设计了核心算法,通过高频采样,把不精确的数据尽可能精确起来。现在精确度基本可以达到 50 米左右。

此外,我们还会在互联网加政府服务领域做了一些数据打通的工作。此前政府的信息化系统基本上相当于一座座数据孤岛,距离数据共享、交换还有一段距离,需要一套政府政务数据流通和交换的生态系统。

这里举一个例子说明我们可以做的事情:在安徽芜湖,我们把原来每个部门一个的政府服务办事窗口从 10 个减少到了 2 个统一受理窗口,工作效率不受影响,反而大大提升。这是因为原来公文流转的速度很慢,而现在可以通过我们的政务数据共享交换平台直接交换各部门的数据和审批结果,所有便民便企服务都可以得到及时处理。

AI 平台上有近9亿用户后,科大讯飞的大数据变现生意要怎么做?

转载请注明出处。


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
  • 苹果将发布AI芯片,欲正面与谷歌亚马逊对决 | 钛快讯

    苹果将发布AI芯片,欲正面与谷歌亚马逊对决 | 钛快讯

  • 养一只这样的AI宝宝 教TA下棋然后吓死自己

    养一只这样的AI宝宝 教TA下棋然后吓死自己

  • 购书福利 | 可能是今年最给力的AI书籍限时优惠

    购书福利 | 可能是今年最给力的AI书籍限时优惠

  • 苹果正研发专门的芯片,为其各类设备提供AI功能

    苹果正研发专门的芯片,为其各类设备提供AI功能