经常有小伙伴咨询毕业后希望从事数据分析岗位。或目前在职希望快速转行为数据分析。
那么在互联网行业从事数据分析工作,需要掌握哪些工具呢?
今天就为大家盘点下,数据分析岗位必须要精通的各大工具与编程语言。
首先是数据库的查询语言-SQL
SQL是数据库查询语言的泛指。
也是数据分析,数据运营区别于普通运营的关键能力之一。
拥有SQL能力,可以在必要时跳过企业既有的数据看板,直接对数据库进行深度查询,获得结果。
关系型数据库有:Mysql,Oracle等。
分布式集群的计算引擎有:hive,spark,presto,clickhouse等。
不同种类的数据库的SQL语法与查询逻辑基本一致。
优化方法上具体会有些许区别。
数据分析岗位涉及的编程语言主要有3个:
Python、R、Julia。
Python:几乎成为了国内互联网圈的数据分析第一编程语言。
无论是使用人群还是教学教程、书籍。在国内的互联网圈基本是人手必备的语言。
在数据的科学计算与处理上,有pandas,numpy,scipy等优秀的库支撑。
机器学习领域也有sklearn等现象级神库。
R语言:专门作为统计分析的语言存在。
在统计上有几乎所有算法的拿来即用的包。
但在国内的教程比较少。欧美的数据分析专业使用R语言的较多。
Julia:科学计算与数据分析语言的后起之秀
MIT研发背书,号称有C语言的速度,Python的简便性。
目前业界用来做科学计算较多,互联网圈内还是属于小众的存在。
BI工具:
BI软件的用途有二:
作为OLAP分析引擎的前端,开发报表。
数据可视化,攥写数据报告时制作漂亮的图表。
目前主流的BI工具有:PowerBI、Tableau、FineBI等。