数据分析实战45讲,即学即用的数据分析入门课

你将获得什么?

  1. 数据分析核心概念和工具;
  2. 数据采集、清洗、分析方法论;
  3. 10 大数据挖掘算法精讲;
  4. Kaggle 实战项目练习。

课程介绍

数据一直都有,但我们从未像现在这样需要数据,渴望数据,因为大数据已经改变了我们思考和决策的方式,并正在创造未来。当下,几乎每个人和每个公司都需要具备数据分析的能力,只有这样,我们才能真正参与到这个海量数据崛起的时代。

但是,说到数据分析和数据挖掘,很多人都是心向往之,却总是望而却步:

  • 要学的东西太多了,从统计学到 SQL,从 Python 到 R 语言,听着就累;
  • 感觉太难了,数据挖掘算法根本学不明白,真叫人头大;
  • 也学了不少东西,但觉得很理论,完全不知道该怎么用。

确实,数据挖掘和数据分析有一些门槛,但是和学习任何新东西一样,它也需要更加高效的方法。事实上,你只需要熟悉数据从采集、清洗到集成的准备过程,掌握最核心的十个数据挖掘算法,重视对工具的熟练使用,从一个个小项目做起,快速积累经验,你就能拥有数据分析这项新技能,有能力真正把数据转化成财富,创造价值。

为此,我们邀请了陈旸来为你讲解数据分析,帮你攻破它。

陈旸,清华大学计算机博士,前 IBM 中国研究院工程师。IEEE & ACM Member,中国人工智能协会成员,中国计算机协会 CCF 大数据专委。

在这个专栏里,他将结合自己的学习体会和实践经验,带你由浅入深掌握数据分析的核心知识点,并且结合案例手把手教你从源头上认识数据分析,熟悉对应的工具操作。同时,为了帮助你融会贯通,专栏还设计了专属题库,保证你能够即学即用。

专栏模块

专栏分为 5 大模块。

预习篇

介绍数据分析的全景图和最佳学习路径。此外还有 3 篇 Python 入门内容,分别是 Python 的基本语法和两大工具 NumPy、Pandas,帮助你快速上手。

基础篇

帮你梳理数据分析的流程,了解数据分析的方方面面。包括数据分析的基础概念、数据采集、数据处理以及数据可视化。

算法篇

算法是数据挖掘的精华所在,也是专栏的重点内容。专栏精选 10 大算法,包括分类、聚类和预测三大类型。每个算法都从原理和案例两个角度学习,帮助你快速理解和应用。

实战篇

理论是铠甲,落实在项目,进行实战才是我们的目标。专栏里精选了 5 个项目,让你在实操中深入理解数据分析,体验数据思维。

工作篇

面试通向数据分析工程师的最后一步,所以这一模块会告诉你面试时需要注意什么,职位的晋升路径又是怎样的?帮你打通最后一关。

课程目录

开篇词 (1讲)
开篇词 | 你为什么需要数据分析能力?
第一模块:数据分析基础篇 (16讲)
01丨数据分析全景图及修炼指南
02丨学习数据挖掘的最佳路径是什么?
03丨Python基础语法:开始你的Python之旅
04丨Python科学计算:用NumPy快速处理数据
05丨Python科学计算:Pandas
06 | 学数据分析要掌握哪些基本概念?
07 | 用户画像:标签化就是数据的抽象能力
08 | 数据采集:如何自动化采集数据?
09丨数据采集:如何用八爪鱼采集微博上的“D&G”评论
10丨Python爬虫:如何自动化下载王祖贤海报?
11 | 数据科学家80%时间都花费在了这些清洗任务上?
12 | 数据集成:这些大号一共20亿粉丝?
13 | 数据变换:考试成绩要求正态分布合理么?
14丨数据可视化:掌握数据领域的万金油技能
15丨一次学会Python数据可视化的10种技能
16丨数据分析基础篇答疑
第二模块:数据分析算法篇 (20讲)
17 丨决策树(上):要不要去打篮球?决策树来告诉你
18丨决策树(中):CART,一棵是回归树,另一棵是分类树
19丨决策树(下):泰坦尼克乘客生存预测
20丨朴素贝叶斯分类(上):如何让机器判断男女?
21丨朴素贝叶斯分类(下):如何对文档进行分类?
22丨SVM(上):如何用一根棍子将蓝红两色球分开?
23丨SVM(下):如何进行乳腺癌检测?
24丨KNN(上):如何根据打斗和接吻次数来划分电影类型?
25丨KNN(下):如何对手写数字进行识别?
26丨K-Means(上):如何给20支亚洲球队做聚类?
27丨K-Means(下):如何使用K-Means对图像进行分割?
28丨EM聚类(上):如何将一份菜等分给两个人?
29丨EM聚类(下):用EM算法对王者荣耀英雄进行划分
30丨关联规则挖掘(上):如何用Apriori发现用户购物规则?
31丨关联规则挖掘(下):导演如何选择演员?
32丨PageRank(上):搞懂Google的PageRank算法
33丨PageRank(下):分析希拉里邮件中的人物关系
34丨AdaBoost(上):如何使用AdaBoost提升分类器性能?
35丨AdaBoost(下):如何使用AdaBoost对房价进行预测?
36丨数据分析算法篇答疑
第三模块:数据分析实战篇 (7讲)
37丨数据采集实战:如何自动化运营微博?
38丨数据可视化实战:如何给毛不易的歌曲做词云展示?
39丨数据挖掘实战(1):信用卡违约率分析
40丨数据挖掘实战(2):信用卡诈骗分析
41丨数据挖掘实战(3):如何对比特币走势进行预测?
42丨当我们谈深度学习的时候,我们都在谈什么?
43丨深度学习(下):如何用Keras搭建深度学习网络做手写数字识别?
第四模块:数据分析工作篇 (2讲)
44丨如何培养你的数据分析思维?
45丨求职简历中没有相关项目经验,怎么办?
加餐 (1讲)
加餐丨在社交网络上刷粉刷量,技术上是如何实现的?
结束语 (1讲)
结束语丨当大家都在讲知识和工具的时候,我更希望你重视思维和实战
结课测试 (1讲)
结课测试 | 数据分析的这些知识,你真的掌握了吗?

讲师介绍

陈旸,清华大学计算机博士,前 IBM 中国研究院工程师。IEEE&ACMMember,中国人工智能协会成员,中国计算机协会 CCF 大数据专委。

(0)
上一篇 2022年1月15日 下午3:23
下一篇 2022年1月15日 下午3:29

相关推荐

发表回复

登录后才能评论