基于推荐系统在量化选股中的应用

2020-06-22 08:35三亚学院信息与智能工程学院宣哲鹏骆销奇董浩王义蒙诚新张晶
河北农机 2020年5期
关键词:排序股票个性化

三亚学院信息与智能工程学院 宣哲鹏 骆销奇 董浩 王义 蒙诚新 张晶

想在海量的数据信息中找到自己需要的信息,或者信息的制造者要让其信息在海量的信息中快速被搜索出来,就要用到推荐系统。从量化选股中的应用来说,推荐系统挖掘用户与所选股票数据之间的关系,在大量的股票数据中找到用户可能感兴趣的股票,并针对用户生成个性化推荐以满足个性化需求。那么,用户在面对大量的股市信息时,不能快速在这些信息中找到有用以及与其相关的信息,本文提出推荐系统应用在股票推荐中,对基本面数据、技术分析数据、新闻资讯等多项指标进行检测与汇总,结合用户平时的偏好,为用户智能推荐符合需求的股票。

1 推荐系统发展

推荐系统的兴起与互联网的发展紧密相关。推荐系统的自动化协同过滤系统最早可以追溯到1994 年,明尼苏达大学计算机系的GroupLens 研究组设计了名为GroupLens 的新闻推荐系统。该工作组不仅首次提出了协同过滤的思想,并且为推荐问题建立了一个形式化的模型,给随后几十年推荐系统的发展带来了巨大影响。该研究组后来创建了MovieLens 推荐网站,一个推荐引擎的学术研究平台,其包含的数据集是迄今为止推荐领域引用量最大的数据集。

2 推荐系统主要研究内容

推荐系统结构一般包括用户信息获取和建模、推荐算法研究、推荐系统的评价问题。推荐系统根据股票用户的兴趣需求信息和推荐对象的模型和特征信息匹配,使用相对应的推荐算法进行计算,找到推荐给股票用户可能感兴趣的股票数据信息。

2.1 用户信息获取和建模

推荐系统通过获取信息与用户交互的系统的转化,将数据挖掘技术应用到信息获取中,挖掘股票用户的内含的隐性需求数据信息。

2.2 推荐算法研究

根据股票用户对个性化推荐的实现接受和认可,设计出准确及高效的个性化推荐算法,内容的推荐和协同过滤是最主要的两种推荐算法,为了克服各算法的缺点,将各种推荐方法混合使用,以提高推荐精度和覆盖率。

2.3 推荐系统的评价问题

为了使股票用户接受推荐系统,对推荐系统作客观综合的评价,推荐出来的结果的准确性、可信性是非常重要的。

3 StockRanker 算法量化选股

3.1LSTM Networks 是递归神经网络(RNNs)的一种,LSTM在股票预测中对小数据集效果很好,可容纳时间序列的记忆效应,如持久性、均值回归等

在深入学习中,长短期记忆LSTM可类比于ARIMA 长期短期记忆模型。LSTM对RNN 进行了结构上的修改,来避免长期依赖问题。LSTM在股票预测中通常分为两类应用:(1)把LSTM输出结果看成单信号从而对个股做回测。(2)把LSTM预测结果看作选择时的信号,与另外的选股模型相结合做回测。

3.2 用户在面对大量的股市信息时,不能快速在这些信息中找到有用以及与其相关的信息,StockRanker 算法是专为选股量化而设计的,核心算法主要是list- wise 排序学习和梯度提升树GBDT

股票市场和图像识别、机器翻译等机器学习场景有很大不同。StockRanker 算法能够充分考虑三者的不同并根据不同的特点,可以同时对全市场3000 支股票的数据进行计算,并预测出股票的大致波动。结合用户平时的偏好,为用户智能推荐符合其需求的股票。StockRanker 算法中的排序学习被广泛应用于监督学习方法,比如推荐系统的候选产品、用户排序,搜索引擎的文档排序,机器翻译中的候选结果排序等;StockRanker 算法梯度提升树(GBDT),有多种算法可以用来完成排序学习任务,比如SVM、逻辑回归、概率模型等;StockRanker开创性地将排序学习和选股结合,并取得显著的效果。

StockRanker 的结构图

4 推荐系统算法的优化

推荐系统广泛应用于为股票用户推荐个性化需求的推荐。一般由基础数据、推荐算法系统、前台展示对用户的历史数据进行处理。以股票用户访问页面、股票的浏览、交易的下单、选股的收藏等多维度信息为基础数据;个性化诉求的推荐有多个算法组成的推荐模型是推荐系统算法系统的主要依据;前台展示即通过用户的客户端系统的响应,返回与之相关的股票推荐信息。

协同过滤算法是在推荐领域中最广泛的算法应用,被称为基于用户行为的推荐算法,其算法不需要预先获得用户或股票的特征数据,仅依赖用户的所使用过历史行为数据并对其进行建模,最后推荐给股票用户。基于用户的协同过滤、基于股票的协同过滤、隐语义模型等是协同过滤算法的主要内容。统计学方法对数据进行分析是基于用户和股票的协同过滤,因此也被称为基于内存的协同过滤或基于邻域的协同过滤。推荐系统中的用户协同过滤算法获得了极大的成功,但其算法本身有局限性。股票的协同过滤算法与用户的协同过滤算法基本类似。该算法以用户对股票或者信息的偏好为依据,发现各个股票之间的相似度,根据用户的浏览历史所显现的偏好信息,将类似度高的股票推荐给用户。隐语义模型是采用机器学习等算法、学习数据得出模型,再进行预测和推荐。

5 总结

目前,深度神经网络发展迅速,为量化选股推荐系统提供了新的特征提取、排序方法,越来越多的推荐引擎将深度神经网络与传统的推荐算法相结合,用于解决数据稀疏、推荐排序等问题,深度神经网络和推荐系统的结合将是推荐系统未来的主要研究方向。让大多数用户接受量化选股推荐系统,需要提高推荐选股结果的准确性、可信性,如何断定推荐结果的准确性,如何将推荐结果展示给股票用户以及如何获取用户的评价,及在推荐算法研究中对克服各自的缺点将各种推荐方法混合使用都是需要深入研究的问题。

猜你喜欢
排序股票个性化
一种融合PageRank和PersonalRank的多层个性化推荐算法
作者简介
坚持个性化的写作
恐怖排序
节日排序
上汽大通:C2B个性化定制未来
本周创出今年以来新高的股票
本周创出今年以来新高的股票
本周连续上涨3天以上的股票
近期连续涨、跌3天以上的股票