好书推荐用Python掌握大型数据集附

作者在探索本地和云中使用Python处理大型数据集的各个方面做了大量的工作,并通过丰富的实践练习教会读者处理大规模数据科学项目的基本技能。—文末附本书PDF下载地址—本书简介现代数据科学解决方案需要简洁、易读和可扩展。在《利用Python精通大数据集》一书中,作者J.T.Wolohan教你如何利用一种受功能影响的Python编码方法来进行一个小项目并将其放大。你将学习一种清晰且可扩展的方法和内置Python工具,如高性能并行方法,以及支持高数据吞吐量的分布式技术。本实用教程中丰富的实践练习教会读者处理大规模数据科学项目的基本技能。本书目录第一部分1引言2加速大型数据集工作:Map与并行计算3映射复杂转换的函数管道4使用惰性工作流处理大型数据集5利用Reduce累积操作6利用高级并行化加速Map和Reduce第二部分7利用Hadoop和Spark处理真正大型数据集8基于ApacheStreaming和mrjob的大数据最佳实践9在PySpark中利用Map和Reduce实现PageRank10利用机器学习和Pypark快速决策第三部分11使用AmazonWebServices和S3处理云端大型数据集12使用AmazonElasticMapReduce在云端实现MapReduce后台私信回复关键字“数据集”,即可获得本文书籍PDF版本及源代码。注:本资料来源互联网,版权归该资源的合法拥有者所有。—完—


转载请注明:http://www.aierlanlan.com/grrz/6558.html