到底是哪些行业与公司在用谷歌的AutoML?李佳的回复亮了
AutoML 出现的最大推动力,源于这个新 AI 应用趋势的显现?
撰文 | 宇多田
到底是哪些类型的公司与行业在用 Google 发布的「易上手版」AI 建模工具 AutoML?!
这才是我们最好奇的问题。
(正在用 AutoML 的公司,请爽快地举起你的双手)
距离 AutoML 发布已经有小半月,这个号称能够帮 AI 专家和企业「自动生成 机器学习模型的工具」已经被各路技术大牛剖析地差不多了。(如果对这套工具的技术感兴趣,请戳 专栏 | 自动选模型+调参:谷歌 AutoML 背后的技术解析)
简单来说,就是「机器学习工程师拿到训练数据、对数据进行分析、然后设计算法、调参生成训练模型」这个专业性极高的流程,被一个 AutoML 替代了。
我们认为,发布这个 AutoML 的最大推动力,根本上是源于新一波 AI 应用趋势的显现:传统行业人士不甘于只被当作「圈外人士」和「被服务对象」。
正因为 AI 逐渐沉入了更多产业深处,Google 云 AI 主管李佳在接受机器之能采访时,把全世界所有想用 AI 技术的用户分为了 3 大类:
1、一种就是对 AI 技术非常熟悉,掌握非常训练的,以及有大量数据的人(公司)。他们可能只需要一些底层架构,譬如 Tensorflow,就能训练出完全属于自己的模型和技术。
2、第二种是通常没有自己的 data,对技术掌握不熟练的人,他们可以选择 API(接口)。通常来说,只要他们提供一张照片,就能马上拿到结果,不需要花时间开发自己的模型。
3、第三种就是有一些想法的用户。他们 AI 技术也不太熟练,但有数据,想定制属于自己的模型。那么就用 AutoML,「不必去标注训练数据,也不用去设计算法,调参,只要将数据集输入到 AutoML 就出来模型了。」
「科普」必须插足的时间:
这里对于「AutoML 训练数据」的问题,根据机器之心蒋码农的解析:AutoML 可使用在 ImageNet 上预训练的模型自动完成训练数据的标注,使用迁移学习(Transfer Learning)和元学习(Learning2Learn)等方法自动挑选合适的网络架构,并自动搜索超参数以获得最好的性能。
其中,根据李佳解释,迁移学习较为简单,可以几分钟便生成模型;而元学习更加复杂,没有给定架构,成本更高,通常需要 1 天才能生成模型,但这个时长已经远远低于传统模型训练流程。
可以想象,对于那些心里想着「AI 这么火我也要独家版本」,但却力不从心,没技术和人才可用的传统行业,性价比最高的好像就是介于 1 和 2 两者之间的 AutoML?
值得注意的是,1 月 18 日发布时 AutoML 还模棱两可的用户数据,在今天得到了李佳的确认:
可以确定,仅 AutoML 这一个 AI 工具的注册用户已经超过 1 万个,包括大量来自传统行业的企业与创业公司。
而据机器之能得到的独家信息显示,这里面的用户,除了被 Google 积极展示出的非盈利组织与机构,譬如动物保护协会使用 AutoML 识别各类珍稀动物,以及「环境组织与卫生部门利用 AutoML 生成模型识别各类垃圾」等案例,还有两类注册数量非常多的行业:
零售与医疗(许多 Google 云的医疗用户在使用)。
由于 Google 首先发布的第一个 Cloud AutoML 是 AutoML Vision(图像识别工具),也就是主要针对「图像分类」这个场景的模型构建工具。
因此,目前在「医疗影像识别」方面有技术需求的医疗行业用户,成为 AutoML 的重度用户之一(Google 自己也在医疗方面有很多探索)。
(目前 Google 仅发布了针对图像分类的 AutoML)
不过,李佳着重提到了零售行业。
在过去 1 个多月里,Google 接待了不少来自传统零售行业的「客户」,他们抱着或咨询或寻求合作的态度来「请教 AutoML 的产业应用问题」。
她在解析 AutoML 的优势时曾讲到,AutoML 对那些有着细微特征差别的图片(产品),有着较高的正确识别率。譬如,在气象领域,十多种不同的云就代表不同的天气,而 AutoML 能够根据每张图颜色及形态的微量变化,识别出不同的天气状况。
那么同理,以服装行业为例,很多衣服的颜色与图案或许一样,但是领口、袖口以及整体的设计风格可能完全不同。在这种情况下,AutoML 具备了让品牌方对产品属性进行自动化加工分类的能力。
「对产品进行分类后,用户喜好拿捏地也会更精准。从目前来看,一些零售公司对 AutoML 最感兴趣的就是『能否用自己设定的标准(譬如颜色、各种标志、特征)对产品进行识别』,然后再应用到产品推荐方面,最终回到用户体验上面。」
然而,网上的技术人士对 AutoML 褒贬不一。
譬如有人认为 Google 针对图像分类这个场景把机器学习技术在易用性上做到了极致;但知乎上也有不少圈内工程师为微软打抱不平,声称 1 年前微软就推出了相似的产品。
与此同时,国内的第四范式,国外的 DataRobot 等 AI 技术公司,也在或免费或收费替传统行业培训机器学习工程师或数据专家,让后者使用自己的平台为客户做机器学习项目。
但是,请注意,到目前为止,我们收到的都是「技术从业者对 AutoML 的评价」,而应用者,特别是行业内的 AutoML 应用者还没有发出一些具体的声音。
因此,在这里,我们也想借这篇文章向零售、医疗、金融等行业内开发者,发出话题邀请:
1、你会选择使用 AutoML 吗?为什么会/不会用?
2、如果使用了 AutoML,你认为它的优点在哪里?最大的问题与挑战在哪里?
3、现在有了 AutoML Vision,你下一个最期待的是什么 AutoML 功能呢?
欢迎与机器之能的小编勾搭!如果你有行业性应用问题,我们有 Google 方的干货回复等着你~(划重点)