要想成为数据科学家,你将面临一个艰巨的挑战。不仅要掌握机器学习等技术,还要学会商业分析。但是,回报也是丰厚的。此外,你还会解决许多有趣的问题,可以掌握新的、有影响力的技术。
本文分享了63个免费的数据科学学习资源,这些资源专门为初学者而准备。
目录如下:
1.基本的技能
1.1程序设计和数据交换
1.2统计和概率
2.技术技能
2.1数据收集
2.2SQL
2.3数据可视化
2.4应用机器学习
3.商业技能
3.1沟通
3.2创意与创新
3.3业务运作与策略
3.4业务分析
4.辅助技能
4.1自然语言处理(NLP)
4.2推荐系统
4.3时间序列分析
5.实践
一些工作可能还需要其他技能,例如:深度学习、大数据、优化、异常检测、图形和网络模型、定量金融、研究领导、项目管理、产品设计、软件工程、空间数据分析等。
本文只介绍行业中最常见的技能。
1.基本的技能
基础技能构成了真正理解的基础,反过来还能让你发现新的解决方案,建立更精确的模型,做出更好的决定。
1.1程序设计和数据交换
首先,您需要了解至少一种脚本语言,足以支持使用数据集、原型模型,并执行分析。
强烈建议在Python或R之间选择,因为它们都是开源的(免费的),被广泛采用,并且由活动社区支持。它们都有自己的长处,但建议一开始就选一个。
Python在软件初创企业、大型科技公司和adTech中更为常见。因为是一种通用编程语言,所以Python往往更灵活。对深度学习和数据处理也有好处。
R/RStudio在研究、金融和分析方面很受欢迎。R语言是一种统计编程语言,它为计量经济学、统计学和机器学习提供了成熟的库。
如果你还在犹豫,建议从Python开始,因为它更适合初学者。
Python资源:
《LearnPythontheHardWay》(在线书籍):推荐给那些想要用Python编程完成课程的初学者。
链接: