数据挖掘(Data Mining)
也称为数据开采、数据采掘等,就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们视线不知道的,但又潜在有用的信息和知识的过程。vx:15376394645
数据挖掘在量化投资中主要应用的两个方面
•应用一:宏观经济和基本面消息分析
股市影响因素很多,但中国股市对宏观政策尤为敏感,数据挖掘的方法,可以把宏观经济和基本面消息进行分类,用打分法来预测当前股市走势和消息面之间的相关性,并对后续的走势进行预判工作。vx:15376394645
•应用二:量化择时方面
运用数据挖掘的方法,可以收集当天与股市相关的所有数据,通过内部的算法进行“模型训练”,把训练好的模型用于预测明日股票或者版块的涨跌概率,这也是数据挖掘方法在择股方面的应用。vx:15376394645
数据挖掘应用的小案例
1、模型的产生:
在数据挖掘算法中有一种关联规则方法的模型。它是表示挖掘的目标是发现数据项集之间的关联关系或相关联系,是数据挖掘中一个重要课题。
2、一个经典的关联规则模型—Apriori 模型
产生背景:
关联规则初提出的动机是针对购物篮分析(Market Basket Analysis)问题提出的。假设超市经理想更多地了解客户的购物习惯,特别是,想知道哪些商品顾客可能会在一次购物时同时购买其他商品?
一个很有名的案例就是“啤酒和尿布”,在美国一家连锁店发现很多男性会在周四购买尿不湿和啤酒,这两种看似不相干的上篇之间显现出强相关性,于是商家可以将啤酒货架放在尿不湿货架旁边以增加收益。
vx:15376394645
应用实例:
行业关联选股法(基于 MATLAB 数据分析软件)
在股市中有一种按照选行业的投资策略,基本思想基于这样的认识:众多个股中选择具有增长潜力的个股难度较大,但是行业数量较少,所以选对行业的可能性会更高。另外,故事同样出现这样的现象,就是同行业的股票往往普涨或者普跌,只要选对行业, 无论怎么选各股,都基本可能盈利。
下面介绍关联规则的数据挖掘方法来进行行业关联选股法。其基本思路是从数据中寻找具有联动关联的行业,当某个行业出现涨势之后,而其相关行业还没有开始涨,则从其关联行业中选择典型个股买入。
对该方法,寻找关联行业是关键,而寻找关联行业,则正好可以用这里的 Apriori 模型。vx:15376394645
量化体系金融数据挖掘
青岛其他商务服务相关信息
23分钟前
52分钟前
1小时前
1小时前
1小时前
13小时前
15小时前
15小时前
16小时前
17小时前