嘘2020年大牛强烈力荐的10个Pyt

北京中科中医院好不好 http://baidianfeng.39.net/a_bdfys/161223/5153159.html

上文收藏!嘘!年大牛强烈力荐的10个Python开发库(上)做了介绍。

本篇将从人工智能应用的Python库来继续下面的介绍。初学Python的读者也可以阅读,都是从每种库的功能和用处来描述的,不会用代码和公式加深晦涩和艰深。

本篇将从人工智能应用的Python库来继续下面的介绍。对AI有兴趣的可以选择如下教程入门机器学习。

6.Hydra和OmegaConf

在进行机器学习项目的研究和实验时,总是有无数的设置可以尝试。在非平凡的应用程序中,配置管理会变得相当复杂,非常快。有一种结构化的方式来处理这种复杂性不是很好吗?

Hydra是一种工具,可让您以可组合的方式构建配置,并从命令行或配置文件覆盖某些部分。

为了说明可以使用该库简化的一些常见任务,我们假设有一个我们正在试验的模型的基本体系结构,以及它的多种变体。使用Hydra,可以定义基本配置,然后运行多个作业,并进行以下更改:

pythontrain_model.pyvariation=option_a,option_b├──variation│├──option_a.yaml│└──option_b.yaml├──base.yaml└──train_model.py

Hydra的表亲OmegaConf为分层配置系统的基础提供了一致的API,并支持YAML,配置文件,对象和CLI参数等不同来源。

21世纪进行配置管理的必备条件!

7.PyTorch

每种提高数据科学团队生产力的工具都值得使用。没有理由让从事数据科学项目的人每次都重新发明轮子,反复思考如何更好地组织其项目中的代码。

每种提高数据科学团队生产力的工具都值得使用。

PyTOrch通过将科学与工程分离来帮助提高生产力。从某种意义上说,它使您的代码更简洁,有点像TensorFlow的Keras。但是,它仍然是PyTorch,您可以访问所有常用的API。

该库可帮助团队利用围绕组织的软件工程的良好实践和明确的组件职责,来构建可轻松扩展以在多个GPU,TPU和CPU上进行训练的高质量代码。一个可以帮助数据科学团队的初级成员产生更好结果的库,但是,由于整体生产力的提高,而没有放弃可控性,更有经验的高阶人士会喜欢它。

8.蜂鸟

并非所有的机器学习都是深度学习。通常,您的模型包含以scikit-learn(例如RandomForest)实现的更传统的算法,或者您使用诸如流行的LightGBM和XGBoost之类的梯度增强方法。

但是,深度学习领域正在发生许多进步。像PyTorch这样的框架正在以惊人的速度发展,并且硬件设备已经过优化,可以更快地运行张量计算并降低功耗。如果我们可以利用所有这些工作来更快,更有效地运行传统方法,那不是很好吗?

这是Hummingbird的用武之地。微软提供的这个新库可以将训练有素的传统ML模型编译为张量计算。这很棒,因为它使您无需重新设计模型。

到目前为止,Hummingbird支持转换为PyTorch,TorchScript,ONNX和TVM,以及各种ML模型和矢量化器。推理API也与Sklearn范例非常相似,后者使您可以重用现有代码,但将实现更改为Hummingbird生成的代码。这是一个值得


转载请注明:http://www.aierlanlan.com/tzrz/3871.html