机器之心原创作者:思Scala替换Python、GPU加速数据科学模型、新建AutoML库,一个超越GoogleAutoML的自动建模系统该怎么设计?自动数据清理、自动特征工程、自动建模与评估,刚入行的人也能玩转的AutoML平台该怎样搞定真实业务?本文满足你对极速建模的一切幻想。昨日,机器之心联合MoBagel(行动贝果)举行了AutoML线下技术分享会,我们很荣幸邀请到两位来自硅谷的技术大咖,MoBagel钟哲民与郭安哲,他们向我们介绍了全流程AutoML技术到底是什么,它能干什么,能做哪些极致优化。在短短的半天中,可能并来不及探讨最深层次的技术问题,但分享会能告诉我们在ML的发展路径中,到底AutoML的哪些研究方向是令人振奋的、哪些工程技术是必不可少的、哪些应用领域是非常有前景的。线下分享会同时还举行了实战工作坊,数十位成功报名的体验者将现场尝试用DecanterAI快速做一个强力的机器学习模型。极速与准确,超越GoogleAutoMLMoBagel在一些Kaggle挑战赛上公平对比了GoogleAutoML系统,包括回归分析、聚类分析与时间序列分析等等。简单而言,GoogleAutoML与DecanterAI会使用相同的数据源,并且在数据都不进行手动处理的情况下,观察两个系统的运行结果与时间。「在准确度上,DecanterAI在多个业务场景平均要高10+百分点」,MoBagelCEO钟哲民表示准确度并不是最为显著的方面,训练速度会有较大的差异。他说:「在相同输入数据下,DecanterAI的训练速度是该系统的倍左右。」DecanterAI与GoogleAutoML的效果对比,其中R-Squared为模型的确定系数,它越接近1,模型对预测值的解释能力就越强。CPU-Hour为模型的效率,拟合同样的数据,CPU-Hour越低,系统的效率就越高。根据Google官方数据,其AutoML系统背后的服务器池达到了块CPU,但测试结果仍然比DecanterAI慢了倍。对于机器学习模型来说,能越早看到结果,就能更早判断数据的好坏,从而加速模型迭代过程。既然在效果和效率上能做到超越GoogleAutoML的性能,那么下面我们可以具体看看全流程AutoML以及DecanterAI到底有哪些令人惊艳的特性。现场分享,从设计思路到体验在一个多小时的分享中,我们能了解到全流程AutoML系统的设计思路及主要机制,也能了解到遗传算法在AutoML中的应用。MoBagelCEO钟哲民说:「我发现大部分AI进展都以研究为导向,这些很厉害的算法都非常有优势,也非常复杂。但当它们具有这样的特性时,要把科研算法应用在正确的业务场景就会变的很困难。因此,我们做的自动机器学习技术希望帮助更快速与准确地完成AI应用。」这是DecanterAI初衷之一,也是AutoML技术的目标。从最开始基于开源框架做一系列的整合与优化,重点
转载请注明:http://www.aierlanlan.com/cyrz/8126.html