我可以用自动机器学习优化您的电子邮件营销策略!

点击上方关注,All in AI中国

我可以用自动机器学习优化您的电子邮件营销策略!

对于全球企业来说,优化营销支出是一个价值十亿美元的问题,因为自2017年以来,每年有超过1万亿美元用于完成这项任务。然而,由于影响销售的内部和外部因素(如心理、天气、情绪、地点、价格、广告等)同时存在且相互竞争,理解营销预算、行动和相关销售之间的关系变成了一项挑战。

机器学习技术由于能够在大型数据集上映射复杂的关系,因此在该领域显示带来了一个不错的结果,但是对于缺乏技术技能和背景的营销人员来说,它们的实施通常是一个障碍。入职咨询顾问数据科学家很昂贵且效率低下,而且在提供有意义和可操作的见解的时候,缺乏对市场营销和被营销的部门的理解。

在Mind Foundry公司,我们认为问题所有者应该获得简单而可靠的工具来构建他们自己的数据科学解决方案,这就是为什么我们建立了AuDaS(一个自动数据科学团队)。在本文中,我们将了解营销人员如何使用AuDaS来设计他们的电子邮件营销活动,以提高他们的客户转化率和保留率。这里将使用Kaggle上托管的Corefactors.in数据集(传送门:https://www.kaggle.com/loveall/email-campaign-management-for-sme/home)。我们尝试预测的3种电子邮件状态根据客户的各种属性和电子邮件的内容,看看它到底是被“忽略”、“读取”还是“确认”。

第1阶段:数据探索

将数据集上传到AuDaS后,我们会看到数据快照以及机器学习生成的有关如何清理和准备数据的建议。

我可以用自动机器学习优化您的电子邮件营销策略!

AuDaS数据准备

例如,AuDaS检测到Email_ID列没有预测能力并且可以被删除。它还在多个列中检测到缺失值,并询问用户是否希望填充或删除它们。

以下图片显示了我们如何通过几次点击触发建议。

我可以用自动机器学习优化您的电子邮件营销策略!

我可以用自动机器学习优化您的电子邮件营销策略!

我可以用自动机器学习优化您的电子邮件营销策略!

AuDaS自动为用户提供建议,同时创建应用于屏幕底部数据的每个操作的审计跟踪。然后,用户可以返回到先前版本的数据集,并在必要时撤销步骤。

AuDaS还自动生成直方图和特征相关性,以向用户提供数据结构的高级概述。

我可以用自动机器学习优化您的电子邮件营销策略!

我可以用自动机器学习优化您的电子邮件营销策略!

阶段2:建模

对于此电子邮件营销数据集,我们希望根据其他属性预测电子邮件的状态(忽略、读取、确认),这意味着我们正在尝试解决分类问题。

在指定了我们正在预测的列(Email_Status)之后,AuDaS提供了一个强大的框架来构建可以推广到其他数据集的分类管道,而不会因为过度拟合而失去过多预测能力。这包括:

为了最终的模型验证目的,自动保留10%的平衡数据集

  • 执行10次交叉验证
  • 优化F1分数
  • 高级用户可以将这些默认值更改为其首选设置(N-fold、split、optimisable metric、…)。

我可以用自动机器学习优化您的电子邮件营销策略!

然后,AuDaS将使用Mind Foundry专有的贝叶斯优化器(OPTaaS)来有效地导航数百万种可能的解决方案,以便在不到100次迭代中识别出最佳的分类流水线(特征工程、模型和最佳参数)。

我可以用自动机器学习优化您的电子邮件营销策略!

在执行此搜索时,AuDaS会在测试的管道、模型和参数值以及相关的性能统计信息和功能相关性方面为用户提供完全透明的信息。

我可以用自动机器学习优化您的电子邮件营销策略!

对于指定的分类模型、字数统计、过去的总通信和主题热度是用于预测电子邮件状态的最相关的功能。用户还可以访问AuDaS尝试过的所有单一模型的完整审计跟踪。

阶段3:模型验证和部署

当用户对模型性能感到满意或已完成100次迭代时,AuDaS将在10%平衡支持上验证模型并给出模型健康的建议。在我们的例子中,对保持数据的测试与优化期间的交叉验证测试一致,模型健康状况良好。这意味着用户可以对模型提供的见解充满信心,并将其部署到生产环境中。

我可以用自动机器学习优化您的电子邮件营销策略!

然后,用户可以上传测试集以预测电子邮件状态结果,为模型评分或通过可以集成到产品中的RESTful API自动部署模型。

我可以用自动机器学习优化您的电子邮件营销策略!

分类模型的API文档

AuDaS还提供LIME对预测的解释,使您能够了解每个特征对预测结果的贡献。一个简单的Web应用程序显示了如何与受过训练的模型进行交互:

我可以用自动机器学习优化您的电子邮件营销策略!

阶段4:提高绩效

在我们的第一次运行中,我们在所有3个类别中的分类准确度为51%,这比随机好,但不理想。根据我们对电子邮件状态值0,1,2表示,忽略,打开和转换的了解,为了提高模型的性能,我们可以尝试重新组合0和1,因为它们的结果对于营销人员来说是相同的。通过在数据准备阶段重新组合类并重新训练模型,我们能够在10%的支持率上实现73.7%的更好的分类准确度。

我可以用自动机器学习优化您的电子邮件营销策略!

相关推荐