AI股神：如何用机器学习预测股价？

EchoYY

2020-07-14

关注关注

本文转载自公众号“读芯术”(ID：AI_Discovery)。

首先要强调，文中只是简单展示了怎样上手H2o.ai机器学习框架，并不作为投资理财的建议。不要简单根据本文就做出任何投资理财的决策。

AI股神：如何用机器学习预测股价？

本文将向你展示如何使用R语言和H2o.ai机器学习框架预测股价。该框架也可以在Python中使用，但因为笔者更熟悉R语言，所以本文就用R语言来演示。以下是详细的步骤：

搜集数据
导入数据
整理并操作数据
分割测试并观察训练
选择模型
训练模型
用模型测试数据
评估结果
如有必要便改进模型
重复步骤5到10，直到对结果满意为止

本文研究的问题是：股票在接下来一小时的收盘价是多少?

数据整理

导入想要通过MetaTrader软件进行预测的资产数据之后，需要更改一些变量。首先，定义变量名称：

#seting the name of variables 
col_names <- c("Date", "Open", "High","Low", "Close", "Tick", "Volume") 
colnames(data) <- col_names 
head(data)

数据格式如下：

我们仅用到开盘价、最高价、最低价、收盘价和交易量等一些能获得的数据，那么就需要清除其他数据：

data$Date <- NULL 
data$Tick <- NULL

因为我们想知道下一个观测期的收盘价，所以需要将下面的值移到上一行，需要用新数据在原始数据集中创建函数并设置变量：

#shifting n rows up of a given variable 
shift <- function(x, n) {  
 c(x[-(seq(n))], rep(NA, n)) 
} 
data$shifted <- shift(data$Close, 1) 
tail(data)

AI股神：如何用机器学习预测股价？

注意，我们已在上一行中给变量收盘价赋了值。所以，在最后一行中会出现NA，我们用na.omit ()函数跳过这一行：

#remove NA observations 
data <- na.omit(data) 
write.csv(data, "data.csv")

OK，数据已准备就绪，可以开始建模了。

分割数据

AI股神：如何用机器学习预测股价？

用H2O.ai进行数据分割。H2O.ai为我们分析和训练人工智能模型提供了一套完整的解决方案，非常好用，即便是没有任何数据科学背景的人也能使用它来解决复杂的问题。先下载H2O.ai：

#Installing the package 
install.packages("h2o") 
 
#loading the library 
library(h2o)

安装加载好后，启动用于建模的虚拟机。启动虚拟机时，必须设置所需的核数和内存参数：

#Initializing the Virtual Machine using all the threads (-1) and 16gb ofmemory 
h2o.init(nthreads = -1, max_mem_size = "16g")

导入数据：

h2o.importFile("data.csv") 
h2o.describe(data)

AI股神：如何用机器学习预测股价？

接着定义想要在数据集中预测的变量，以及那些用于训练模型的变量：

y <- "shifted" #variable we want to forecast 
x <- setdiff(names(data), y)

随后，分割数据，分别用于训练和测试，其中80%用于训练数据。

parts <- h2o.splitFrame(data, .80) 
train <- parts[[1]] 
test <- parts[[2]]

完成这些步骤，就是时候见证H2O.ai创造奇迹的时候了。

选择模型

每一位数据科学家在创建自己的机器学习项目时，必须完成的一项任务便是识别出最佳的一个或一组模型来进行预测。这需要大量的知识，尤其是深厚的数学基础，来决定针对特定任务的最佳方案。

我们可以借助H2O.ai来选择最佳模型，这样就可以腾出时间解决其他问题，这便是自动建模。虽然这可能不是解决问题最有效的方法，却是一个不错的尝试。

训练模型

创建模型，需要调用automl函数并传递必要的参数：

automodel <- h2o.automl(x, y, train, test, max_runtime_secs = 120)

几分钟后，我们就能获取一个按性能顺序排列的模型列表：

运用模型

现在，可以用模型来测试数据啦!你还可以用模型对尚未观察到的数据进行性能评估，以模型和测试数据作为参数调用预测函数：

predictions <- h2o.predict(automodel@leader, test)

好啦，静待一小时，看看你的预测能否成真吧。

机器学习 python机器学习 data 人工智能

EchoYY

0 关注 0 粉丝 0 动态

关注关注

关于机器学习管道需要了解什么?

企业高管经常将机器学习模型的黑盒性质视为一种神秘技术，他们通常认为，IT主管能够有效调动流程，并使模型表现良好。现实情况是，了解机器学习流程的基础知识可以使其流程和步骤变得不再神秘，而IT团队可以更好地管理对当今竞争激烈的商业环境至关重要的机器学习技术。机

jaybeat 2020-11-17

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

如果不能用Python执行机器学习，那该用什么呢？

长期学习数据科学的人一定知道如何用Python、R和Julia这些语言执行机器学习任务。然而，如果速度很关键，但硬件很有限，或者所在公司仅使用SQL进行预测分析，又该怎么办呢?答案就是——数据库内的机器学习。下面将使用Oracle机器学习在著名的Iris数

mori 2020-11-06

这里有你需要的5个机器学习必备技能

机器学习，听起来很酷。这名字不禁令人以为是一排机器人坐着学习知识的样子，但其实是让机器人拥有像人一样的学习能力的高端技术，这样就能高效快捷地从数据中找出有用的东西。云计算服务支持构建和部署AI及机器学习应用程序的种种功能。除了专业外，作为IT团队成员一定要

jaybeat 2020-11-02

在云端你需要的5个机器学习技能

机器学习和AI继续深入IT服务中，并补充软件工程师开发的应用程序。如果IT团队想跟上这种步伐，必须提高他们的机器学习技能。云计算服务支持构建和部署AI及机器学习应用程序的各种功能。在很多方面，AI系统的管理与IT专业人员在云端熟悉的其他软件非常相似。但是，

changyuanchn 2020-11-01

如何通过7个步骤构建机器学习模型

组织构建一个可行的、可靠的、敏捷的机器学习模型来简化操作和支持其业务计划需要耐心、准备以及毅力。部署和管理机器学习项目通常遵循相同的模式。对于许多组织来说，机器学习模型开发是一项新活动，但是在某种程度上已经建立了以数据为中心的项目构建方法。此外，这种方法由

人工智能 2020-11-19

为什么所有的机器学习模型有90％从没有投入生产

公司不仅可以向数据科学家和机器学习工程师投入资金，还希望魔法能够实现。根据VentureBeat的报告，大约90%的机器学习模型从未投入生产。尽管十分之九的技术主管认为AI将成为下一次技术革命的核心，但AI的采用和部署仍具有增长的空间。为了帮助数据科学家发

flyfor0 2020-11-16

全面解读谷歌云人工智能如何为机器学习提供帮助

谷歌公司拥有行业规模最大的机器学习堆栈之一，目前以其Google Cloud AI和机器学习平台为中心。谷歌公司在数年前就开源了TensorFlow，但TensorFlow仍然是一个最成熟的、并且广泛引用的深度学习框架。同样，谷歌公司几年前将Kubern

Pokemogo 2020-11-16

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

人工智能如今已成为大街小巷的热议话题。企业为了吸引客户和目标用户，在生产产品、提供方案时总会使用机器学习、深度学习等花哨的词汇。但实际上，这些词汇绝不仅是“噱头”而已。科技大厂了解科技发展的主流趋势，且无法承担技术落后的风险，所以他们都已适应了此次计算机革

clong 2020-11-13

10个丰富自我的机器学习项目

机器学习项目有很大的发展潜力，最近大火的韩剧也出现了这个词语并且用很浪漫的说法解释了它。毕竟招聘者一般通过你拥有的技能来判断你的潜力。此外，确保所有数据集都呈现开放状态允许自由访问。很多机器学习课程将这个数据运用于教学目的，它可以预测人类的活动类别，这是一

ohbxiaoxin 2020-11-13

机器学习如何颠覆金融行业

在过去的十年中，金融行业采用了很多前所未有的尖端技术。金融科技初创厂商是智能手机、大数据、机器学习、区块链等新技术的早期采用者，被认为是被更传统的银行和金融机构所效仿的潮流引领者。机器学习和深度学习的最新进展确实推动了计算机视觉和自然语言处理的界限。Sta

Icevivian 2020-11-13

IT自动化和人工智能将在2021年走向何方？

随着IT自动化和人工智能技术的进步和发展，IT人员的工作方式发生了重大变化。今年发生的突如其来的新冠疫情，也迫使大多数组织的员工在家远程工作。如果疫情持续蔓延到2021年，那么组织将会继续让员工远程工作，并采用多种工作方式混合策略或鼓励永久性远程办公，因此

CSDN人工智能头条 2020-11-11

无监督机器学习的重要指南

人们如今正处在数字化转型时代，只有一个不变的因素——进化。而组织采用的高科技解决方案正在引入数字化转型。因此，毫不奇怪的是，技术进步已完全取代了平凡的业务。因此，人们需要了解无监督机器学习在各行业中的广泛应用。如果用户标记了可以作为示例的训练数据，人们将其

mogigo00 2020-11-11

理解AI：为什么要在人工智能系统中寻求可解释性呢？

本文转载自公众号“读芯术”。或许这是你第一次听到人工智能前面加“可解释的”这个形容词，但其实它的涵义你一定能理解。可解释的人工智能是指构建AI应用程序的技术和方法，人们借此以理解它们做出特定决策的原因。换句话说，如果我们可以从AI系统获得有关其内部逻辑的解

白飞飞Alan 2020-11-11

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

微软和谷歌一直在积极研究用于训练深度神经网络的新框架，并且在最近将各自的成果开源——微软的PipeDream和谷歌的GPipe。原则上看，他们都遵循了类似的原则来训练深度学习模型。这两个项目已在各自的研究论文中进行了详细介绍，这篇文章将对此进行总结。对于初

深圳克林斯曼 2020-11-09

IT自动化和人工智能将在2021年走向何方?

EastCarFxxBlog 2020-11-09

强化学习到底是什么，它如何运作？

强化学习是一种行为学习模型，由算法提供数据分析反馈，引导用户逐步获取最佳结果。不同于使用样本数据集训练机器模型的各类监督学习，强化学习尝试通过反复试验掌握个中诀窍。强化学习与人类在婴幼儿时期的学习过程非常相似。这是一种基于经验的学习流程，机器会不断尝试、不

83153251 2020-11-06

数字营销：AI如何“看透”人类行为模式？

人工智能在市场营销领域取得的成功，揭示了人类的一些思维和行为模式，这些模式可以转化为其他应用程序。市场营销业已成为AI创新的试水之地，尤其是在人类行为建模和AI与人类交互探究层面更具实验价值。目前AI的局限性阻碍了机器使用溯因推理或创造性思维的能力。AI已

lizhengjava 2020-11-05

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 2020-11-19

机器学习新风暴：如何用ML模型预测房价？

从驾驶汽车到识别语音+翻译，机器学习通过软件预测变幻莫测的现实世界，正在人工智能领域掀起一场风暴。机器学习是教计算机系统使用反馈的旧数据进行预测的过程，基本上是训练计算机根据过去的数据预测未来的数据。机器学习大致分为两大类：监督学习和无监督学习。对此可以使

81510295 2020-11-17

安科网

AI股神：如何用机器学习预测股价？

EchoYY

EchoYY

相关推荐

关于机器学习管道需要了解什么?

Python 用5行代码学机器学习—线性回归

如果不能用Python执行机器学习，那该用什么呢？

这里有你需要的5个机器学习必备技能

在云端你需要的5个机器学习技能

如何通过7个步骤构建机器学习模型

为什么所有的机器学习模型有90％从没有投入生产

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

理解AI：为什么要在人工智能系统中寻求可解释性呢？

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

IT自动化和人工智能将在2021年走向何方?

强化学习到底是什么，它如何运作？

数字营销：AI如何“看透”人类行为模式？

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

机器学习新风暴：如何用ML模型预测房价？

EchoYY