会Excel,还有必要学习Python做

北京中科白癜风医院地址 http://www.bdfyy999.com/bdf/showelite.asp

众所周知,Python是一款非常优秀的编程语言,具有简单易学、多种应用场景、开源免费等优势,它在数据科学、人工智能、网络开发等领域得到广泛应用,成为了目前最受欢迎和流行的编程语言之一。

以前在数据分析课上,经常有做HR数据分析的朋友问我,是否有必要学习Python。我一直的观点是:没必要。因为Excel可以解决日常工作中的大部分数据分析问题。实在解决不了的,你可以找专业的数据分析师,没必要自己再去学习编程。

Python虽然很强大,但是学起来麻烦,如果你不是需要成天写代码的码农,学了编程后大概率会很快忘掉,很多人最后都有一种“从入门到放弃”的深刻体验。

但是,在使用了像ChatGPT这样的AI工具一段时间之后,我觉得非常有必要重新思考上面这个问题了。做数据分析的同学,不但有必要学习,而且非常有,因为这会加倍的提升你的工作效率。

为什么这么说呢?一般人学习编程最大的障碍是学完代码容易忘掉。现在有了AI这个助手,你并不需要记住详细代码。用自然语言直接把需求告诉AI,剩下的代码AI会自动帮你写完。

不过,你暂时还不能%的无脑依靠AI提供的代码。这也是为什么你依然需要懂一点编程的基础,因为AI提供的代码可能需要你做个别地方的手动调整。

简单来说,Python在数据分析上比Excel有以下优势:

1数据读取

Excel虽然有友好的用户界面和易于学习的特点,但是面对大数据量时处理能力有限。理论上,当数据量万行或1.6万列时,Excel会变得缓慢和不稳定。

大家平时应该也能感受到,当数据量超过1万行时,Excel的效率会明显降低,系统甚至容易死机。因此,对于需要处理大数据量的任务,Excel并不是最优选择。相反,Python非常适合大数据量的处理,上万行的数据处理起来基本上就是瞬间的事情。

举个例子,我们公司从电商网站上每天下载的销售数据量都是上万行,数据存储在Excel或CSV格式文件中。如果要把多个这样的文件整合为一个文件,用Excel进行数据读写,可能需要手动打开每个文件,然后复制和粘贴数据到同一个工作表中,耗时耗力。

但如果使用Python完成以上任务,只需要写一行代码(几秒钟)即可完成。记住,如果你有了GPT这个助手,你并不需要去记住这行代码,随时把你的需求抛给GPT就好了。当代码生成之后,你只需要按照实际情况修改下代码中的文件名和路径即可:

代码运行之后,你的整合数据后的新文件就立刻出现在了你所指定的文件路径下。

2数据清理

Excel可以进行基本的数据清理操作,例如删除重复数据、筛选和排序数据、提取和拆分文本数据等。但在面对复杂的数据清理和转换任务时,Excel的功能会变得有限。而Python提供了丰富的数据清理和转换库,可以进行更加复杂的数据清理和转换操作,例如数据的分组和重塑等。

举个例子,你手上有一张上万行数据的表格,表格中一些数据缺失和数据重复,你希望把这些缺失数据以及重复数据所在行全部删除掉。如果用Excel处理,你需要逐列进行手动筛选,然后再删除空值和重复值。考虑到Excel处理大数据的缓慢,整个工作的效率可想而知。

但是,以上任务如果你用Python来完成,也就是一两行代码和几秒钟的事情,甚至都不需要你直接打开原始数据表,以上任务就已经自动完成了。具体代码如下图所示:

数据转换

我们有时候需要把表格中的数据进行转换,比如把量化数据转化为非量化数据。在Excel中的做法是先筛选,再手动修改。同样,如果数据量巨大,则耗费的时间和精力都会不少。

举个例子,我有下面这张数据表格,我需要把租金按大小进行分类:

其中租金小于0为“便宜”,租金在0到之间为“适中”,租金大于为“昂贵”。用Python代码来实现这个转换,只需两三段代码即可自动解决:

同样,上面截图的代码虽然看上去较多,但是用户无需任何记忆,只需要把要求抛给AI,剩下工作它自动帮你完成。

4数据建模

Excel可以进行基本的数据建模和分析操作,比如可以做简单的线性回归数据建模,但是Excel对于高级的数据建模和分析任务的支持有限。

相反,Python提供了强大的数据建模和分析库,可以进行复杂和高级的数据建模和分析任务,例如机器学习建模。

举个例子,假设你是一家电商企业的销售负责人,你想了解客户的消费行为和购买习惯,并根据这些信息对客户进行市场分类,以便有针对性地定位企业的市场营销策略。

在收集完好大量客户的购买信息之后,你需要用到机器学习中的一个算法:聚类分析,将这些客户划分为不同的群体,以便更好地了解他们的购买习惯和消费行为。

这样的高级分析任务,Excel是无能为力的,只能通过Python完成。

总结

Excel更适合用于简单的数据分析任务和小规模的数据集处理,如果你的数据量没有达到成千上万,并且只做基础的计算与统计,用Excel更适合。

Python更适合用于复杂的数据分析任务和大规模的数据集处理。尤其是,如果你想实现数据自动化,完成分类、预测等高级数据分析,用Python更适合。

提醒以下大家,得到数据之后得有专业的Python知识去分析才可能得到答案。

我自己也很喜欢Python,收藏了很多技术干货,可以共享给喜欢我文章的朋友们,干货内容包括:需要学习的小伙伴可以私信02获取~

整理这些确实不容易,有时候辛辛苦苦整理出来的东西又被一些别有用心的人随便扒拉去了,所以做原创真的很难,如果你觉得这份笔记大全真的对你有用,还望支持一下,感谢大家啦!

相关推荐阅读:

自学python?一般人我还是劝你算了吧


转载请注明:http://www.aierlanlan.com/rzdk/9270.html

  • 上一篇文章:
  •   
  • 下一篇文章: 没有了