基于机器学习的股票交易时机研究.docx
《基于机器学习的股票交易时机研究.docx》由会员分享,可在线阅读,更多相关《基于机器学习的股票交易时机研究.docx(43页珍藏版)》请在课桌文档上搜索。
1、彳彦文1人孝毕业设计(论文)题目基于机器学习的股票交易时机研究专业信息与计算科学班级2006级1班学生余开勇指导教师韩逢庆重庆交通大学2()1()年6月摘要IABSTRACTII第一章前W11.1 研究背母11.2股市预测的发展概况11.3 支持向星机简介31.4 本文的主要内容3第二章股市知识的准备52.1引言52.1.1我国股票市场的发展52.1.2进行股票投资分析的必要性62.2股票的相关知识62 .2.1股票常用术语73 .2.2股票价值和股票指数72.3 企业财务指标92.4 股市技术指标简介9第三章股市预测问题研究方法123.1弓I言123.2投资分析法123.2.1技术分析法12
2、3.2.2基本面分析法123.2.3组合分析法133. 3时间序列分析法133.3 .1ARMA模型简介143.4 非线性系统分析法143.4.1 神经网络预测方法概述143.4.2 多层前做神经网络(Bp网络)15第四章统计学习理论与支持向量机174.1 理论背兔174.1.1 机器学习分类174.1.2 机器学习存在的基本问题174.2 统计学习理论184.2.1YC维194.2.2推广性的界194.2.3结构风险最小化(StTUCtUraIRiskMinimization.SRM)204.3支持向量机基本原理214. 3.1基本概念225. 3.2线性支持向量机236. 3.3非线性支持
3、向量机257. 3.4基于支持向量机的回归分析28第五章基于支持向量机的股市覆测315.1 基T支持向量机的股市预测流程315.2 基丁向量机的分析预测工具1.iB325.3实际预测结果与数据验证分析335.4股票交易时机的确定38结束语40致谢41片文献42股票市场是一个复杂的非线性动态系统,但由传统的预测技术并没有准确的揭示股票市场的内在规律,导致最终的预测结果并不十分理想,本文采用了支持向量机的方法对股市进行预测.支持向量机是数据挖掘中的项新技术,是借助于最优化方法解决机器学习问题的新工具。特别是近年来支持向量机在回归算法的研究方面也表现了极好的性能,但是将其应用到股市预测中却并不多。本
4、文介绍了股市的相关背景知识,然后对股市里的常用术语作了介绍以及对传统的股市预测的方法进行了介绍,特别详细介绍了基于神经网络的预测方法。接着全面介绍了统计学习理论和建立在其上的支持向量机方法,详细描述了支持向量机方法的基本原理。最后,对支持向量机方法用于股市预测问题进行了尝试。提出了使用支持向量机的方法进行股市预测的基本流程,然后通过使用实际的股市交易数据进行预测,在具体股价的预测都表现出很好的效果。关键词I股票,股市预测,支持向量机,核函数ABSTRACTStockmarketisacomplexnon-linearsystem,andisaectedbymanyfactors.Thetrad
5、itionalpredictiontechnologiescannotdisclosetheinherentruleofstockmarket.Inthispaper,anewprediction(ecnologybasedonSupportVec(orMachine(SVM)hasbeenproposed.Thesupportvectormachineisadataminingnewtechnology;itisanewtoolthatdrawssupporttheoptimizedmethodtosolutethemachinelearningquestions.Speciallyinre
6、centyears,supportedthevectormachinealsotodisplaytheextremelygoodperformanceinthereturnalgorithmresearchaspect,butappliedit(hestockmarkettoforecastcertainlywerenotactuallymany.Thispaperintroducethebackgroundknowledgeofstockmarket,thencommontermsonthestockmarketwasinixluccdandtraditionalpredictiontech
7、nologiesarcinlxluccdindetail,especiallythetechnologybasedonneuralnetwork,andthenthebasicprinciplesofSVMarediscussed.Finally,(hispaperusesSVMtopredictthepriceofstock,andproposeacommonIrainework(osolvestockmarketpredictionproblemsusingSVM.Datafromrealstockmarketisusedtoevaluatetheexactnessofthealgorit
8、hm.ResultshowsthatSVMisanetYectivemethod,andgetpreciseresult.KeyWords:Stock,PredictionofSlockmarket,SUPpOrlVectorMachine,Kenielfunction第一章前言1.1 研究背景股票是市场经济的产物,股票的发行和交易促进了市场经济的方展。自从股票1773年在英国率先发行以来,已有二百多年的历史。现在已经成为整个社会经济的“时雨表”和“报警器”,其对于经济发展的作用不可估量。随着股票市场的不断规范壮大和计算机技术的发展,越来越多的人进入到股票交易市场,也相应产生了很多股票分析和预
9、测系统。由于股市行情受经济政治等因素的影响,其内部规律非常复杂,变化周期无序,同时我国资本市场投资者结构具有特殊性,个人投资者的比例很高,投资者的心里状态不同,对股票交易的行为会产生直接的影响,导致股价波动.在信息爆炸的今天,迫切需要一种方法能从大量的数据信息中提取出有用的信息,数据挖掘技术在这种情况下诞生了。确切的说,数据挖掘(DataMining)是指从大型数据仓库中提取出隐含的、未知的、非平凡的及仃潜在的应用价值的信息或者模式.它是数据库研究中个很有应用价值的新领域.融合了数据库、人工智能、机器学习、统计学等多个领域的理论和技术。在最近十几年间,成熟的技术和高性能的关系数据库引擎以及广泛
10、的数据集成,使数据挖掘技术的研究工作取得了很大的发展,各种数据挖掘技术的应用极大的提高了分析、处理大量数据信息的能力,并为人们的生产生活带来了很大的经济效益,数据挖掘技术在股市预测中也具有很强的应用价值。1.2 股市预测的发展概况预测是指从已知事件测定未知事件。预测理论作为一种通用的方法论,既可以应用于研究自然现缴,也可以应用于研究社会现象。聘预测理论应用于各个领域,就产生了硕测的各个分支,如人口预测、经济预测、气象预测等等。在金融经济学的发展上,人们对金融预测作了大垃的探索,取得r丰硕的成果。典型的金融预测时是时间序列预测。时间序列是按照时间顺序取得的一系列观察值。时间序列的典型特征是相邻观
11、测值之间的依赖性.为研究这种依顺性,人们提出r许多时间序列模型,并对这模型的性痂及分析方法进行了深入的研究。传统的金港时间序列大致上有两种研究方法,一种方法是从基本的经济原理Hl发建立金滋时间序列服从的数学模型,像MarkOVitZ的投资组合理论,资本资产定价模型(CAPM)川、套利定价理论(APT)、期权定价模型川等。实际上,这部分成果就是确定金触时间序列的趋势项。另种方法是从统计角度对金融时间序列进行研究。这种方法直接从实际数据出发,应用概率统计推断出市场未来的变化规律。虽然这种方法从经济学角度来讲缺乏理论性,但是在实际应用中效果较好。而11,统计方法还可以对经济模型的好坏进行检验和评价。
12、二十世纪80年代以前,人们对时间序列的研究主要集中在一种线性模里,即自回归移动平均模型(AutoRcgressivcMovingAverageModcs.ARM/X).这种模里结构简雌,有着完善的统计推断技术,应用非常广泛。但是ARMA模型毕竟是一种线性模型,有些实际现象在模型中得不到反映。在这种情况下人们开始提出并研究非线性时间序列,最道要的就是R.F.Englc在八I年代初提出的自回归条件异方差模型(AutoRcgrcssivcConditionallyHctcrosccdasticMtxlcls,ARCH),由于ARCH模型将方差看作随时间变动的量,而不是一个常垃,从某种程度上克服J线性
13、模型的局限性。与实际情况更相符,从而得到了广泛的应用.股市预测,是金融经济预测的一个重要分支.它对股票市场所反映的各种资讯进行收集、整理、综合等工作,从股市的历史、现状和规律性出发,运用科学的方法,对股巾.未来发展前珏进行测定。股市预测般基于以下三点假设四:(1)有效市场假设:指股票市场会对每一条有可能影响股价的信息都会作出反映,而各种价格的变动正是这种反映的结果。(2)供求决定假设:指一切信息都会对股票市场的供求双方力量对比产生影峋,供求决定交易量和交易价格。(3)历史相似原则:指由历史资料所概括出来的规律已经包含了未来股票市场的一切变动趋势。股市预测按不同的标准可以有不同的分类.按涉及的范
14、围不同可分为:指数预测和个股预测:按预测时间长短不问可分为:长期预测、中期预测和短期预测:按预测方法的不同可分为:定性预测和定量预测等等。CharlesDOW在190()年到1902年,写了系列的评论来阐述他的市场观。SamNelson收集了他的评论并将他的观点发展为市场行为原则,这就是成为技术分析基础的道氏理论。RichardSchabacker第个将通用图表形态分类,研究出“缺口”理论,被称作技术分析科学之父。瑞夫N艾略特通过研究市场波动和循环的形态,提出了“波浪理论二W-DGann研究了时间要素的重要性,提出了“价格时间等价”的概念。随后,又出现了各种分析方法,包括K线图分析法、柱状图分
15、析法、点数图分析法、移动平均法、形态分析法、趋势分析法、角度分析法、神秘级数与黄金分割比螺旋历法、四度空间法等.这些分析方法主要依赖T图表,图表信息具有明显的直观化优点,但图表的分析与指标的选择却要依靠主观的判断.这是这些分析方法面临的主要问题。由于股票交易的模式和相关信息的笈杂性,这样种严重依靠经验的方法.其可器性在很大程度上是要受到痂疑的同。从60年代开始,人们尝试使用各种时间序列分析方法来预测股市。在时间序列分析中,线性模型的研究比较成熟。但是股市是一个非线性系统,用线性模里逼近容易丢失有用信息。为了更确切描述实际系统特性,又发展了阈值自回归模型、多项式自回归模型和指数自回归模型等,用这
16、些方法对股市进行建模和预测也取得了比较好的结果。1.3 支持向量机简介支持向量机4F(SUPPortVCCtOrmaChinC,SVM)是数据挖掘中的一项新技术,是借助于最优化方法解决机器学习问题的新工具。它最初于20世纪90年代由VaPnik提出,近些年来在其理论研究和算法实现方面都取得了突破性进展,并开始成为克服“维数灾难”和“过学习”等传统困难的有利办法,虽然他还处在飞速发展的阶段,但它的理论基础和实现途径的基本框架已经形成。支持向量机目前主要来解决分类问题(模式识别,判别分析)和回归问题.支持向量机的最大特点是改变了传统的经验风险最小化原则,而是针对结构风险最小化原则提出的,因此具有很
17、好的泛化能力。另外,支持向量机在处理非线性问题时,首先将非线性问题转化为高维空间中的线性问题,然后用个核函数来代替高雄空间中的内积运算,从而巧妙地解决了宓杂计算问题,并Jl有效地克服了维数灾难以及局部极小问题。尽管支持向量机有以上的优点,但是在金融时间序列预测这方面研究还很少。Tay和Cao证明5种金融时间序列数据可以用支持向量机进行预测,并指出,支持向量机在标准均方误差,均方绝对误差,趋势正确率,加权趋势正确率标准卜优于人工神经网络。Kyoung-jaeKim用支持向量机对股市指数的运动趋势进行预测。1.4 本文的主要内容股票市场受很多因素影响,变化规律很难把握。本文采用统计学习理论的支持向
18、量机方法进行了股市预测问题的研尢。主要完成了以下工作:(1)介绍了股市的相关背*知识,并对传统的股市预测问题的研究方法进行了总结,指出了它们的优缺点。(2)介绍了统计学习理论与支持向量机,然后在此基础上提出了通过支持向量机进行股市预测的具体流程,并使用实际股票交易数据检验J基丁支持向量机的预测方法的实际效果。实验结果表明,应用支持向员机的方法进行股市预测具有良好的预测精度。第二章股市知识的准备2.1 引言2.1.1 我国股票市场的发展中国的证券市场形成于上个世纪九十年代初期,经过十几年的发展,我国股票市场已初具规模,股票已成为现代人生活中的一个歪要组成部分,股票投资已成为社会公众谈论的中心之一
19、.随若我国资本市场的快速发展我国资金触通的垂心已由货币市场逐步向资本市场转移。越来越多的人把股票投资作为自己金融资产增值的主要方式。股市是股票市场的简称,也称为二级市场或次级市场,是股票发行和流通的场所,也可以说是指对已发行的股票进行买卖和转让的场所。股票的交易都是通过股票市场来实现的.一般地,股票市场可以分为一、二级,一级市场也称之为股票发行市场,二级市场也称之为股票交易市场。股票市场是上市公司筹集资金的主要途径之、随着商品经济的发展,公司的规模越来越大,需要大量的长期资本。而如果单牯公司自身的资本化积累,是很难满足生产发展的需求的,所以必须从外部筹集资金。公司筹集长期资本一般有三种方式:一
20、是向银行借贷:二是发行公司债券:三是发行股票。前两种方式的利息较高,并且有时间限制,这不仅增加了公司的经营成本,而且使公司的资本难以稳定,因而有很大的同阳性。而利用发行股票的方式来筹集资金,则无须还本付息,只需在利润中划拨一部分出来支付红利即可。把这三种筹资方式综合比较起来,发行股票的方式无疑是破符合经济原则的,对公司来说是最有利的。所以发行股票来筹集资本就成为发展大企业经济的一种重要形式,而股票交易在整个证券交易中因此而占有相当重要的地位.我国的沪深股市是从一个地方股市发展而成为全国性的股市的.在1990年12月正式营业时,上市的股票数量只有为数很少的几只,其规模很小,Il上市的股票基本上都
21、是上海或深圳的本地股,如上海的老八股中只有一支是异地股票。在其后股市的发展中,由于缺乏战略性的考虑,造成了资金的扩容与股票的扩容不同步,特别是资金扩容,其速度远远快于股票扩容。在1991年至1996年的五年间,股市的供求关系极不平衡,这样就造成了股价在最初两年出现暴涨的局面。股票市场的变化与整个市场经济的发展是密切相关的,股票市场在市场经济中始终发挥着经济状况晴雨表的作用。所谓“牛市”,也称多头市场,指市场行情普遍看涨,延续时间较长的大开市。所谓“熊市”,也称空头市场,指行情普遍看淡,延续时间相对较长的大跌市.2.1.2 进行股票投资分析的必要性股票投资具有增值快、风险大的特点,中国股市的这种
22、特点更为突出。当前大多数的股票投资后并不能很好的把握市场的发展规律,对于过量的信息缺乏筛选、识别的能力,因此对于股票的投资往往是盲目的、非理性的。进行股票投资分析的必要性在于:第一,股票属于现险性资产,其风险由投资者自负,所以每一个投资者在做每一个决定时都应遂慎行事。而收益往往伴随着高风险,在从事股票投资时,为了争取尽可能大的收益,并把可能的风险降到最低限度,首先我们要做的就是认其进行股票投资分析.第二,股票投资是一种智慈型投资。长期投资者要注蓝于培本方法,短期投资者则要注重技术分析。而要在股市上进行投机,更是一种需要而超智就与勇气的举动,其关键是把握好时机才去投资.而时机的把握需要投资者综合
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 股票交易 时机 研究
链接地址:https://www.desk33.com/p-1479019.html