如何打造一款中国的Alexa?(2)
2017-05-15 编辑:
自然语言理解领域的语义表示是有组合性,而推理的建模强调因果性,很多时候自然语言理解需要有目的、有计划的有步骤的优化过程,而且强调步骤之间的逻辑关系,而现阶段的深度学习更像是一个黑盒子,他只可解决自然语言的中的部分问题,特别当涉及到对话领域,上下文的理解时,深度学习的黑盒子就显得局限很多。
目前比较适合的机器学习算法是生成模型,但是生成模型需要针对问题去建模,其强调的是建模的重要性。利用此类方法建模,一般需先针对问题中的子问题进行“元模型”建模,然后通过有限的推理方法来组合成更大的模型,其推理过程体现的因果关系清晰可见,可以从结果反馈来追本溯源,逐步优化推理中的每个环节,即使在小样本集上往往也能训练出好的效果;而且生成模型推理过程中涉及的参数比较少,一般都对应具体的物理含义,具有很好的可解释性。
迁移学习和增强学习
交互的目的是为了决策,而决策需要记忆和学习。
长期的记忆是用户的个性化习惯或者用户画像的学习,短期的记忆则是对话中最小的可复用的单元,需要去捕捉,这也是建立在前面提到的多轮对话之上。
而在学习方面,戴帅湘在强调迁移学习和增强学习的重要性。
对于人来讲,在特定场景学习到的知识,人类并不会选择将其固着在唯一的场景中,知识的场景迁移能力使人在学习新知识时理解起来更加容易,掌握起来更加迅速,即使是从未接触过的领域和场景,人类也能完成知识迁移。
比如找餐厅的任务,它可能需要地理位置知识、菜系、交通信息等。如果只是单项知识的简单叠加,而不能认识到各领域知识之间的关系,缺乏知识的推理能力,那么当面临更为复杂的任务时就失效了。
从被动到主动
现在绝大部分的系统都是被动交互型,以现在非常流行的闲聊为例,其只能依赖于用户说的话,根据之前大量对话实例的训练,来生成一句似是而非的回答,以此消磨时间,抑或点燃情绪。
对话式决策系统一个非常重要的功能是需要对环境变换能做出感知,进而转化为语言的表示,来和用户进行主动交互。
如果用户刚在家中通过语音助手找到了附近吃日料的A餐厅,走上车启动车载系统,车载系统中的语音助手如果根据上下文位置变化及开车这一动作进行主动发问:“主人,请确认是否为您导航到A餐厅?”,这种情况下,系统的主动发问是一个非常智能的表现。
类似的主动服务可能是语音助手的一大竞争力。
从软件到服务
在未来屏幕交互的方式不再是主流,屏幕进一步变小,甚至消失,取而代之是更接近人与人之间的交互方式,语音,动作,以及各种传感器的自动检测,也因为如此,在不同场景下不同的智能设备得以出现,承载了一种或多种应用能力,软件之间的边界消失了。
曾经的软件供应商退化成服务提供商,专注于提升其核心数据和算法的质量,软件的开发成本降到最低,但是其使用效率却得到了极大提升,智能化得以极大体现,这是一个机器逐步模仿,并最终超越人类的时代。
硅谷密探推出全新互动直播平台 — 硅谷Live
为你带来全球化创新、实践、经验分享
相关阅读:
相关推荐: