引领风骚,对话未来——WWW2017参会有感(2)
2017-04-25 编辑:
微软与WWW2017
今年微软共有20篇长文被接收,涵盖了社会计算、用户建模、互联网挖掘与搜索、理论算法、普适计算、计算健康等众多领域,而微软亚洲研究院的员工为其中5篇作了贡献,可谓硕果累累。此外,微软亚洲研究院的刘铁岩等研究员们带来了关于分布式机器学习的教程[8]。
本次,我为我们团队的一篇长文Restaurant Survival Analysis with Heterogeneous Information做了口头报告和一篇poster CCCFNet: A Content-Boosted Collaborative Filtering Neural Network for Cross Domain Recommender Systems作了展示。在给微软产品部门打造用户流失分析模型的过程中,我们进而思考如果研究的对象不是消费者,而是商家本身呢?类似的问题是否需要不同的解决方案呢?这属于商家风险评估问题,相对于个体消费者,它有更多的因素值得考虑。
在经济与管理领域,学者们喜欢用商家的经济指标去评估它们的破产风险。但其实这些指标比较不容易获取,甚至有些商家为掩饰经营不善而伪造数据。因此我们提出利用万维网上广泛又免费的资源,通过数据挖掘技术去构建商家存亡预测模型。
文章主要从四个维度建模:商家地理位置、消费者移动规律、评分规律以及用户评论内容。我们发现,比较之下,地理位置特征的作用比较弱,因为大部分商家在开店之前,已经对位置精挑细选过一番了;用户评论内容是最丰富的信息源,其中最强的负面特征是团购有关的关键词——其实这也不难理解,因为团购往往不能带来利润(例如10元包下午场的KTV团购券),而如果商家只能通过团购吸引客户,它自然面临很大的倒闭风险。我们的poster论文[10]是我们在推荐系统的最新进展。我们发现,深度学习在极大影响着推荐系统的发展,但目前的推荐系统并没有把深度内容学习和协同过滤学习完美的结合起来。因此我们设计了一种神经网络,用于把协同过滤和内容学习统一在一个网络模型下。其实我们对CF的建模上与本次大会的一篇长文[6]原理是一致的,站在学生的角度来看,正在进行的项目和别人“撞衫”了,当然是悲伤的;但是站在WWW大会精神的角度看,我们也并肩站在前沿科技的阵列,同时做了一点微不足道的贡献,自然也是欣慰的。
作者简介
练建勋,中国科学技术大学与微软亚洲研究院联合培养博士在读生,导师为谢幸博士与孙广中副教授。研究兴趣包括用户建模、推荐系统和深度学习。在微软亚洲研究院实习期间,曾与微软Skype, Office 365, Bing News等产品组紧密合作,享受把理论研究与实践相结合的过程。
文中提到的WWW2017论文:
[1] Modeling Consumer Preferences and Price Sensitivities from Large-Scale Grocery Shopping Transaction Logs
http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/proceedings/p1103.pdf
[2] Monetary Discount Strategies for Real-Time Promotion Campaign http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/proceedings/p1123.pdf
[3] Predicting Latent Structured Intents from Shopping Queries http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/proceedings/p1133.pdf
[4] User Personalized Satisfaction Prediction via Multiple Instance Deep Learning http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/proceedings/p907.pdf
[5] Do "Also-Viewed" Products Help User Rating Prediction? http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/proceedings/p1113.pdf
[6] Neural Collaborative Filtering
http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/proceedings/p173.pdf
[7] The Paradigm-Shift of Social Spambots: Evidence, Theories, and Tools for the Arms Race
http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/companion/p963.pdf
[8] Distributed Machine Learning: Foundations, Trends, and Practices http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/companion/p913.pdf
[9] Restaurant Survival Analysis with Heterogeneous Information http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/companion/p993.pdf
[10] CCCFNet: A Content-Boosted Collaborative Filtering Neural Network for Cross Domain Recommender Systems
http://papers.www2017.com.au.s3-website-ap-southeast-2.amazonaws.com/companion/p817.pdf