首页 > 社会焦点 > 正文

聚焦应用和图计算、十亿级大规模机器学习,大数据议题曝光(2)

2017-04-30 编辑:

  讲师简介:陶征霖,浙江大学本硕毕业,先后就职于Oracle,EMC,Pivotal和北京偶数科技有限公司。一直从事数据库相关领域的开发研究工作。隶属于HAWQ核心团队成员, 参与了HAWQ 1.X ~ 2.0的核心研发工作,后任Apache HAWQ Committer和PMC成员。现就职于创业型公司北京偶数科技有限公司,负责设计研发高性能HAWQ++大数据管理引擎。

  议题简介:HAWQ++是由Apache HAWQ创始团队打造的HAWQ增强企业版本,采用了MPP和Hadoop结合的创新MPP++技术架构,高可扩展,遵循ANSI-SQL标准,提供PB级数据交互式查询能力。并且提供对主要BI工具的描述性分析支持。兼容Oracle,GPDB和PostgreSQL,原生支持Lava和Kubernetes平台,可以帮助企业无缝迁移到最新的云计算平台。演讲涵盖以下三大块内容:1.Apache HAWQ的总体架构和主要模块简介。2.HAWQ++相比于Apache HAWQ的新特性。3.HAWQ++的安装部署和基本用法。

  听众收益:本次演讲适合所有希望了解Apache HAWQ或HAWQ++的用户。帮助用户大体了解HAWQ的基本架构和主要组件,熟悉HAWQ的基本用法,包括sql/plsql,odbc/jdbc以及madlib的使用。共同探讨HAWQ的适用场景,助力用户数字化转型。

  聚焦应用和图计算、十亿级大规模机器学习,大数据议题曝光

  熊永平 北京邮电大学计算机系副教授

  演讲议题:基于Spark的统一数据管理与数据探索平台

  讲师简介:北京邮电大学网络技术国家重点实验室副教授,中科院计算所博士,先后在诺基亚研究中心、中国电子信息产业研究院等单位,从事网络安全、移动物联网、数据科学和数据挖掘等领域的研究开发工作,主持和参与了国家自然科学基金、科技部重大专项、973等多项国家科研项目。在IEEE Transactions on Mobile Computing、ACM MobiCom等国内外著名期刊会议上发表论文30多篇,单篇论文他引次数超过210次。近年来在大规模数据处理和机器学习领域进行了深入研发,其研究成果转化到保险、金融、能源等多个领域的大数据应用系统中,取得了良好的效果。

  议题简介:随着大数据理念的不断普及,计算机行业正在变成真正的信息行业,企业关注的重点正在转向数据,整合挖掘各类数据资产实现精细化的业务运营已经成为企业的共识。而这种精细运营依赖于高效的数据管理和精准的数据洞察,这就需要发现隐藏在各种原始业务数据相互关联背后的本质和规律。而实际业务数据往往分散在孤立的信息化系统和关系数据库中,缺乏统一的数据处理平台。本团队设计开发了以内存计算框架Spark为核心的统一数据管理和探索平台,该平台提供规范化的数据接入和各种语言的数据处理任务接口,提供以数据表为计算单元和DAG模型来支持复杂的数据Transform过程,进而支持各种数据探索、相关性分析(离散相关、近似相关、简单相关等)、可视化分析等手段,对海量数据进行统一管理、探索和建模。

  听众收益:

  1. 了解企业级大数据应用中真正需要的大数据平台组件和功能;

  2. 保险等行业应用中的数据相关性分析模型。

  聚焦应用和图计算、十亿级大规模机器学习,大数据议题曝光

  李扬 滴滴出行资深软件开发工程师

  演讲议题:Hbase在滴滴出行的应用场景和最佳实践

  讲师简介:李扬,现任滴滴出行资深软件开发工程师。2015年加入滴滴出行基础平台部,主要负责HBase和Phoenix以及相关分布式存储技术。开发了基于HBase的地理位置索引程序,解决了key-value数据库对于查询给定地理范围内所有用户GPS轨迹困难的场景。在滴滴之前,曾在新浪担任数据工程师,专注于分布式计算和存储。

  议题简介:随着滴滴在业务上的迅猛发展,如何在分布式存储上满足用户对海量数据的实时查询是日常工作的重要内容。在这种多租户场景下,如何资源分配,风险管理,成本控制,监控及运维面临着各种挑战。本议题将介绍HBase在滴滴出行针对各种典型应用场景及解决方案。

  听众收益:将了解Hbase在多租户场景下各种使用场景,及管理解决方案。

  聚焦应用和图计算、十亿级大规模机器学习,大数据议题曝光

  尚峰 金电联行首席技术官

  演讲议题:数据驱动的大数据金融应用

  讲师简介:尚峰,金电联行首席技术官。1998年清华大学机械工程系硕士毕业,2002年留学日本,2005年情报数理专业博士毕业,现任金电联行(北京)信息技术有限公司首席征信技术官,曾任职多家信息技术相关公司,经历了信息技术的政务/企业信息化、数据仓库、互联网、电子商务等多个发展阶段,主导过各类型信息系统的研发。随着大数据技术发展,目前专注于大数据技术应用方法论研究及具体实践。

  议题简介:金融行业是新技术应用的领先行业,也是个业务需求复杂多样的行业。传统Fintech为金融行业解决了大量的问题,但随着各种理念创新、技术创新,金融行业面临更多的挑战。大数据理念与技术的兴起,似乎给金融行业迎接新挑战提供了一种解决途径,但大数据的应用同样面临众多问题,例如专业知识、人员配备、数据聚合、技术组合等。本报告将介绍,在借鉴工业革命的组织理念与方法基础上,高效、高质、规模化地利用(大)数据技术应对快速、多样化金融需求的理念与方法,同时给出金电联行在此方面的探索实践。

  聚焦应用和图计算、十亿级大规模机器学习,大数据议题曝光

  张军 HanSight瀚思高级技术工程师

  演讲议题:大数据安全分析在电子银行业的探索与实践


大家都爱看
查看更多热点新闻