社会焦点

【280页JP摩根报告】大数据和 AI 策略——面向投资的机器学习和另类数据方法(2)

字号+ 作者: 来源: 2017-05-22

在根据数据来源对数据进行分类之后,我们还要提供另一个投资人士可能更为感兴趣的分类方法。一个零售版块的投资组合经理可能更关心的是特定的销售数据,而无所谓它们是卫星生成的还是消费者志愿填写的。高频交易者

  在根据数据来源对数据进行分类之后,我们还要提供另一个投资人士可能更为感兴趣的分类方法。一个零售版块的投资组合经理可能更关心的是特定的销售数据,而无所谓它们是卫星生成的还是消费者志愿填写的。高频交易者关心每天产生的数据,比如推特、最新发布等等,但不太关心有明显延迟的信息,比如信用卡数据。在下图这个“投资分类”中,我们为各种另类数据标示了不同的属性,这些属性和投资专业人士比如 CIO、投资组合经理等高度相关。

  【280页JP摩根报告】大数据和 AI 策略——面向投资的机器学习和另类数据方法

  机器学习技术的分类:怎样才算是人工智能

  大型和较少结构化的数据集通常不能用简单的电子表格工作和散点图进行分析。我们需要新的方法来解决新数据集的复杂性和规模。例如,使用金融分析师的标准工具不可能对非结构化数据(如图像,社交媒体和新闻稿)进行自动分析。即使在大型传统数据集上,使用简单的线性回归往往会导致过度拟合或不一致的结果。机器学习方法可用于分析大数据,以及更有效地分析传统数据集。

  毫无疑问,机器学习技术在应用于图像识别,模式识别,自然语言处理以及自动驾驶汽车等复杂任务时,产生了一些惊人的成果。那么,机器学习在金融中的应用是什么,这些方法相互之间有何不同?

  首先需要强调,任务的自动化不是机器学习。我们可以指示计算机根据固定的规则执行某些操作。例如,如果资产价格下降了一定量(止损),我们可以指示电脑出售资产。即使给机器(也称为“符号人工智能”)大量复杂的规则,并不意味着就是机器学习,这只能说是任务的自动化。使用这个“符号人工智能”,机器在遇到与此前预编程的规则不匹配的情况时,只会选择自我“冻结”。

  在机器学习中,给予计算机一个输入(一组变量和数据集),输出是输入变量的结果。该机器然后发现或“学习”在输入和输出之间起到链接作用的规则。

  最终,这个学习任务的成功会被进行“样本外测试”,也就是,在未知的情景下,测试它所获得的这种连接变量和可能的预测结果之间的关系能力。

  机器学习可以是监督的或无监督的。在监督学习中,我们试图找到一个规则,一个可以用来预测变量的“方程式”。例如,我们可能想要寻找一种能够预测未来市场表现的能力(趋势跟踪)信号。这可以通过运行先进的回归模型来评估哪一个具有较高的预测能力,并且对于regime变化最为稳定。

  【280页JP摩根报告】大数据和 AI 策略——面向投资的机器学习和另类数据方法

  在无监督学习中,我们发现了数据的结构。例如,我们可能获得了市场回报,现在尝试确定回报的主要驱动力。例如,一个成功的模式可能会揭示,在某个时间点,市场受动量因素、能源价格、美元水平以及与流动性有关的新因素的驱动。深度学习是一种机器学习方法,可以分析在多个层级上学习数据(因此“深度”)。 我们经常说的自动化的目标是执行易于定义但执行起来乏味的任务,而深度学习 AI 系统的目标是执行难以定义但易于执行的任务。深度学习本质上与人们学习的方式更相似,因此是人为重建人类智慧的真正尝试。

  深度学习用于非结构化大数据集的预处理(例如,它用于计算卫星图像中的汽车,识别新闻稿中的情绪等)。在假设的财务时间序列示例中,深度学习预测(或估计)了市场修正的概率。我们可以将大量的数据集输入到深度学习模型中。该模型可能首先确定一些对市场产生负面影响的简单特征,例如动量崩溃,波动性增加,流动性下降等。这些因素单提出来可能不会导致市场纠正(market correction)。此外,算法可以识别这些简单特征之间的模式和它们之间的非线性关系。从这些模型中,它可以构建更复杂的特征,如EM 驱动灾难(EM driven crises),财务压力,这些最终可能导致更为显著的市场纠正(market correction)甚至衰退。

  【280页JP摩根报告】大数据和 AI 策略——面向投资的机器学习和另类数据方法

  上图显示了交易策略中各种机器学习/人工智能及其潜在应用。最初,先提供灰框中的步骤给算法(作为训练集的一部分),然后由机器学习算法生成绿色框中的步骤。

  在另类数据中实施机器学习的主要步骤

  鉴于风险和不确定的回报,许多投资者都在思考何时应该采用更具量化性的、数据驱动型的投资方法。首先我们简要概述实施过程中的主要步骤(例如有多少需要外包、内部构建大数据/机器学习所需的人才、典型的技术设置等等)。如下图所示:

  【280页JP摩根报告】大数据和 AI 策略——面向投资的机器学习和另类数据方法

  首先需要识别和获取数据。数据采集团队可以直接通过数据所有者/供应商或聚合第三方数据的专业公司(并与供应商和最终用户相匹配)来获取新数据源的使用权。一旦许可协议到位,数据需要存储和预处理。大数据很少呈现出干净的形式,一般都无法直接提供给机器学习算法使用。需要专门的团队预处理数据(例如检测异常值、缺失值等)。数据科学团队由量化研究人员组成,借助机器学习、反向测试策略和可视化技术分析数据,根据数据推导出可交易信号或见解。最后,信号由投资组合经理实施,或者在某些情况下以自动化方式执行(这将涉及到系统的另一层和将信号链接到执行系统的软件专家)。

  我们认为,大数据与机器学习革命将深刻改变投资环境。随着越来越多的投资者采用大数据,市场的反应将更快,并将越来越多地期待传统或“旧”数据源。这将为量化经理和愿意采用和了解新数据集和分析方法的人们提供优势。那些不学习、拒绝进化的人将面临过时的风险。不管这些变化的时间表如何,我们认为,分析师,投资组合经理、交易者和首席信息官最终将不得不熟悉大数据和机器学习的发展和相关的交易策略。

相关阅读:

  • 深度学习和机器学习的区别
  • 机器学习与数据挖掘
  • python机器学习
  • r机器学习方法
  • 经典网络都市另类【女总裁爱上我
  • 吴恩达机器学习讲义
  • jp摩根是什么意思
  • 图解机器学习pdf下载
  • 不管谁在谁不在另类词
  • 女生感情另类词
  • 我以为我很出名另类词
  • 喊另类我喊出灵魂
  • 相关推荐:

  • 华为史上最美操作系统,你绝对不能错过的EMUI5.0
  • 国产操作系统典范:deepin操作系统
  • 娱乐办公两不误!这个笔记本能把屏幕拔下来写字
  • 斗鱼响应新规加强监管,坚持打造优质精品直播
  • SpaceX 火箭爆炸原因确定:液态氧过冷成了固态
  • 华为Mate9中国版真机秀 你绝对没发现它有两种版本
  • 99%的人都不知道的微信高效使用术?
  • 乐视网一周蒸发88亿元 贾跃亭反思节奏发展过快
  • 似乎已经战胜传统渠道的小米 今年为什么被OPPO、vivo 打败?
  • 优雅商务风,性能一鸣惊人—TCL 950体验评测
  • 转载请注明出处。


    1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

    相关文章
    • 苹果将发布AI芯片,欲正面与谷歌亚马逊对决 | 钛快讯

      苹果将发布AI芯片,欲正面与谷歌亚马逊对决 | 钛快讯

    • 养一只这样的AI宝宝 教TA下棋然后吓死自己

      养一只这样的AI宝宝 教TA下棋然后吓死自己

    • 购书福利 | 可能是今年最给力的AI书籍限时优惠

      购书福利 | 可能是今年最给力的AI书籍限时优惠

    • 苹果正研发专门的芯片,为其各类设备提供AI功能

      苹果正研发专门的芯片,为其各类设备提供AI功能