首页 > 社会焦点 > 正文

大会|惊喜与挑战并行的NSDI 2017(3)

2017-04-27 编辑:

  大会|惊喜与挑战并行的NSDI 2017

不只是CDN,这种方法很容易应用到其他的相似场景,即上层有复杂而多变的数据访问模式(Access pattern)的带有缓存的系统。

更进一步的说,在系统中引入机器学习方法来代替固定的阈值,我认为是一个相对通用的方法,并且这种方法有可能在很多情况下都会有好处。系统或者网络本身也许能学习感知到上层不同应用不同的数据访问模式,从而自适应其特性,调整到更加合适的配置之下。然而这又为系统本身增加了复杂性和不确定性,毕竟稳定性、简单可靠、乃至可复现是基础设施平台一直以来的追求。所以说,这并不是放诸四海皆准的灵丹妙药,但是也是一个很有趣的新思路。

CherryPick【8】是来自耶鲁和微软等四个机构的多方合作项目,其研究关注在云系统的调度层面,一个云端服务可以应用不同的系统配置。然而,为了达到相同的性能,不同的配置可能会导致高达12倍乃至更多的成本耗费上的差别,这一点在重复性作业 (recurring job) 上显得尤为突出。自动的在低搜索空间下为云端服务找到最优配置所带来的经济性自然是不言而喻。文章使用了一个简单的贝叶斯优化 (Bayesian Optimization) 来帮助优化搜索过程,决策搜索哪个配置下的运行性能,以及什么时候停止搜索以找到最优的系统配置。我觉得这个工作建模的系统指标项还是相对来说比较简单的,仅考虑任务占用的VM、CPU、内存、磁盘、网络等静态系统指标,并不考虑数据、系统当前总资源占用、任务间的相互干扰之类的当前整个系统状态相关的问题。其使用简单模型针对这一特定问题固然有其好处,但是不一定适合更加复杂的情况。正如Google曾透露他们已经试图用强化学习优化一些调度问题一样,我相信机器学习在系统领域应用的研究才刚刚开始。采用数据驱动的方法,通过对于数据的分析和问题的建模,可以帮助我们加深对于复杂系统的理解,减少乃至避免经验性的阈值和静态配置,而这些新的方法论最终将反过来影响网络系统的设计。

VideoStorm【9】是普林斯顿的Haoyu在微软研究院实习的时候做的工作。随着DNN在图像视频领域的物体识别追踪上的不断发展,利用这一方法实时的分析监控摄像头的数据,完成如车辆追踪这样的人工智能任务已成为现实的需求。这篇文章针对这样一个典型的人工智能应用,探讨在给定资源下,综合考虑多种视频流任务的不同质量和不同延迟这一需求,如何分配云端资源来同时处理成千上万个视频流数据任务的方法。这个系统已经在美国华盛顿州的贝尔维尤市完成部署,为实时交通数据的分析服务。这个实际的问题是深度学习从理论走向实践的过程中会遭遇的现实挑战,随着更多这种应用的部署,相关的网络系统都蕴含着更多类似的新研究机会。

Big Data session中的四篇文章有三篇跟机器学习相关,第一篇是来自于伯克利RICE实验室,其前身是AMPLab,其产出不止包括有影响力的论文,更是有影响力的开源项目和创业公司,由Databricks公司主导的Spark项目已经在大数据领域发展出繁荣的生态链。而在这次的NSDI上,他们发表了Clipper【10】系统。这是一个以通用性和低延迟为目标的机器学习服务(serving) 系统,对用户端提供统一的接口,而底层则适配多种框架,包括 Spark MLlib,Caffe,Tensorflow,Scikit-Learn等,从而简化这种服务系统的部署工作。Clipper系统通过应用缓存(caching),批处理(batching),以及自适应模型选择(adaptive model selection)来优化延迟,提高吞吐率、准确率、和鲁棒性。在当前机器学习技术广泛应用,深度学习框架繁荣发展的现状下,Clipper携Spark在大数据系统上的领先地位和MLlib,试图用一个前端框架一统model serving部分,可以说是雄心勃勃。然而不同于大数据时代,如今深度学习有更多的底层框架,比如说CNTK和MXNet,也更加依赖异构的硬件平台,比如说GPU、FPGA和以Google的TPU为代表的ASIC,以及计算密集型应用要求对于性能上的极致压榨,这些都为大一统平台带来了更多的挑战。这次他们能否成功,我们将拭目以待。


大家都爱看
显卡2017年暴涨原因:比特币疯涨 炒家狂购显卡挖比特币致一卡难求显卡2017年暴涨原因:比特币疯涨 炒家狂购显卡挖比特币致一卡难求 揭高考准考证4大谣言6大骗局 千万别上当打电话 2017高考时间表揭高考准考证4大谣言6大骗局 千万别上当打电话 2017高考时间表
查看更多热点新闻