小白学数据小抄放送 Python,R,大数据,机器学习
2017-03-21 编辑:
大数据文摘作品,转载要求见文末
作者 | Elaine,田桂英,Aileen
导读:前段时间小白学数据专栏出了一期Python小抄表,后台反应强烈(点击查看大数据文摘小白学数据系列文章)。确实,数据科学越来越热,但是对于想要学好它的小白们却很头疼一个问题,需要记住的操作和公式实在是太多了!小抄表是很实用的办法,那么今天我们就为大家送出一份大杀器:28张小抄表合辑!不管你是Python或R的初学者,还是SQL或机器学习的入门者,或者准备学习Hadoop,这里都有能满足你的资料。
目录:
1.数据科学专场: Python小抄表
2.数据科学专场:R的小抄表
3.机器学习小抄表
4.概率小抄表
5.SQL和MySQL小抄表
6.大数据小抄表
小白:上次你给我的Python小抄表真的很好用呢!特别适合我这种初学者。
答:太好了!我们收到不少读者反馈,希望推出更多小抄表的资料。我们这一期小白学数据专栏筛选了28份小抄,根据覆盖面、清晰度和内容实用性,分别涵盖了机器学习、数据科学、概率、SQL和大数据的领域。里面包括了你所需要的工具、流程、各种包和语言。
第一部分
数据科学专场:Python小抄表
小白:我们先来回顾一下之前聊过的Python。帮我们这样的小白介绍一下有什么Python方面的小抄吧?
答:入门的话有两张表必须强推:
1. Python的数据科学快速入门指南
如果你刚入门Python,那么这张小抄表非常适合你。查看这份小抄表,你将获得循序渐进学习Python的指导。它提供了Python学习的必备包和一些有用的学习技巧等资源。
2. Python基础小抄表
这张由Datacamp制作的小抄表覆盖了所有Python数据科学需要的基础知识。如果你刚开始用Python,可以留着这张做快速参考。背下这些小抄的代码变量、数据类型函数、字符串操作、类型转换、列表和常用操作。尤其是它列出了重要的Python包,给出了用于选择并导入包的小抄代码。
小白:是的,就是上面这张表让我很快掌握了基本的Python语句!我记得还有几张关于Python常用库NumPy和Panda的小抄也特别实用?
答:是的。这些常用库可以使你轻松进行探索性数据分析和各种数据整理。以下3张小抄表几乎涵盖了所有常用的语句啦!
3. Python用于NumPy的数据科学小抄表
NumPy是Python用于科学计算的核心包。这又是一个由DataCamp制作的小抄表,你会找到用于创建NumPy数组的小抄代码,用于执行数学运算,构造子集、分层、索引和数组操作。这份小抄最特别的是它给每个函数做了分类,并用简单的英语做了解释说明。
4. 在Python中做探索性数据分析
在Python中进行探索性数据分析的最佳包是NumPy, Pandas和Matplotlib。通过它们,你将学会如何在python中加载文件,转换变量,分类数据,绘图,创建样本数据集,处理缺损数据等等。这张表总结了三个库中常用的语句,这是用于探索性数据分析的最简单的小抄本之一。
5. Panda库小抄表
Pandas是非常重要的Python包之一。这张表专门介绍Pandas。如果你想要了解在Python中使用Pandas进行探索性数据分析时所涉及到的每一步操作,那么这份小抄将是你的首选。表里的代码能够用于读写数据,预览数据框,重命名数据框列,汇总数据等。
小白:我在研究用Python实现可视化,有什么小抄可以帮忙么?
答:这里有两份小抄是专为你准备的。
6. Python的数据可视化
无论是数据科学家还是非专业人士,可视化对他们来说都是最容易理解的。通过可视化图表,数据能够栩栩如生地得以展示。这份小抄就让你学会用各种姿势在Python中进行数据可视化。一步步地找到方法绘制直方图、柱状图、线图、散点图等。
7. Bokeh小抄表
Bokeh是Python的交互式可视化包,尤其是对于大型数据集极为有用。通过这个由DataCamp制作的小抄,你将学会绘图,呈现程序和可视化定制,保存并创建统计图表的基本操作。
小白:不够啊~还有别的么?
答:Scikit-Learn专用小抄和文本清洗教程喜欢么?
8. Scikit-Learn小抄表
这是为使用Python中scikit-learn模块的每种方法准备的小抄表。它给出了不同的函数,用于数据的预处理、回归、分类、聚类、降维、模型选择和指标以及它们对应的说明。这份小抄最特别的是它涵盖了机器学习的完整阶段。
9. Python文本数据清洗步骤