社会焦点

经验分享|互联网金融数据产品开发

字号+ 作者: 来源: 2017-04-28

经验分享|互联网金融数据产品开发

  编辑部

微信公众号

关键字全网搜索最新排名

『量化投资』:排名第一

『量 化』:排名第一

『机器学习』:排名第四

我们会再接再厉

成为全网优质的金融、技术类公众号

激烈竞争,翻倍增长,互金深浅不试怎知?

真实数据,真实环境,真实投资人如何打动?

10万美金,创新应用,谁是未来的互金引导者?

经验分享|互联网金融数据产品开发

  把握未来十年的价值风口,让技术的力量不再沉默,拍拍贷魔镜杯再度启动:10万美金奖金池,500万美金创投基金,邀你与全国优秀选手同台竞技。不论你是专业的数据分析师、精湛的应用开发者、还是超强的产品设计师,抑或是技能全通的实力全才,魔镜杯数据应用大赛都可为你提供挑战的舞台。

  经验分享|互联网金融数据产品开发

  拍拍贷为本次赛事提供丰富的业务场景、真实脱敏的数据及多种功能的可调用接口,参赛选手将直面投资者需求,打造数据应用,优秀作品团队可直接获得天使投资。本次赛事由科赛网优秀选手,拍拍贷技术专家组成技术分享团,每周一期分享会,欢迎你的加入。

互联网金融数据产品开发

  分享嘉宾

  王海洋,上海交通大学信息工程系在读博士生。研究方向为时空数据挖掘与智能交通。热爱数据分析挖掘与可视化,曾获得上海市首届数据创意应用大赛冠军,中国计算机学会第二届大数据应用创新大赛冠军,拍拍贷魔镜杯第一届互联网金融开发大赛冠军。

◆◆◆

为什么会参赛

当时参加比赛最主要的原因还是出于兴趣。之前参加了一些相关的数据创意、数据产品的比赛,使我们有了一种好奇心,如果从数据的视角看一件事,会有哪些新的insight,会发现哪些容易被我们忽视却至关重要的细节?而互联网金融这一新兴行业,高风险与高收益并存,既有新平台的不断加入也有旧平台的跑路,有的人投资获得了高额利润,也有人失掉了多年积蓄。我们希望运用我们的数据分析技术,从数据的视角看互联网金融行业,希望从中得到一些有趣且有意义的发现,并开发出一款数据产品,使别人也能通过我们的产品更加了解互联网金融这一行业。

◆◆◆

数据产品的设计

我们之前做过较多数据分析,涵盖了很多领域,包括了多种应用。结合之前的经验,我们在技术上其实遇到的困难并不大。然而互联网金融是我们第一次接触的领域,这使我们在产品设计上遇到了较大的挑战。我认为,解决这一问题最有效的方法是跨界头脑风暴。各行各业的人在一起讨论,以多个视角看待同一问题,所产生的集体智慧会对我们产品设计提供极大的帮助。我们当时是用跨界合作解决这一问题的。在导师的帮助下,我们咨询了很多具有多年经验的投资者、互联网金融领域的专家、资深的产品经理以及设计方面的共创者,进行头脑风暴,了解投资者的痛点、互联网金融产品的设计模式以及更加友好的交互体验。通过不断的改善和迭代,最终实现了我们的产品。

关于产品设计网络上有很多高质量的文章,在此我就不再赘述,我仅分享一些我认为数据产品设计中最重要的几个内容。

  1.精准定位用户群体与需求

产品是给用户用的,而不是给我们自己用的。设计数据产品的过程中一定要考虑用户,既要定位好产品适合的用户群,也要设计好这些用户的实际需求,而不是我们想象中的需求。另外,设计需求时也要结合实际,包括已有的数据是否支持,已有的技术可否实现。在我们的作品中,我们将投资者分为初级投资者和资深投资者。资深投资者有自己的决策方案,他们往往喜欢选择高风险高回报的投资产品,这一类用户不是我们的主要服务对象。我们最希望帮助的是那些占绝大多数的初级投资者,为他们客观精确的量化平台风险、智能定制的推荐可靠平台。

  经验分享|互联网金融数据产品开发

  2.要有一个灵魂

灵魂就是产品的核心、亮点,让人能够眼前一亮的东西,也是区分你的产品与其他人产品最重要的部分。这一块值得精心设计以及花精力完善,一个有创意有意义的产品灵魂会使得作品不再平铺直叙。产品灵魂不应多,一般来说有一个就够,但一定要足够“亮”,即具有较强的创新性。我们的作品中,基于深度学习的平台风险量化模型OMNIRank就是我们作品的灵魂,既是一个新的研究问题,也是新的技术方法。

  经验分享|互联网金融数据产品开发

  3.颜值很重要

作品的颜值也是不可忽视的一块,即使作品内容再好,没有好的颜值也难以展示出它的价值。包括数据产品网站或者APP的设计,以及作品PPT的设计。因此好的数据可视化,以及UI设计、交互设计至关重要。我们的作品中采用了很丰富的数据可视化,从多个维度展示了各大平台的功能,并有很好的交互性。 PPT的制作上当时也请设计的朋友做了美化。

  经验分享|互联网金融数据产品开发

◆◆◆

相关技术的学习

我分享一下我们在比赛中用到的技术,以及我对数据产品开发中技术学习的看法。我们主要用到的技术如下:

  爬虫: python的urllib库,beautifulsoup库;

  基本数据处理:MySQL, python基本语法与数据结构,python的pandas库;

  海量数据处理: Hadoop的HDFS, Spark的RDD;

  数据建模: python的keras(建模),python的scikit-learn(对比);

  数据可视化:R语言的ggplot2,Web框架Flask, Js的ECharts、D3;

转载请注明出处。


1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章