钱多多股票论坛

trader1688.com
 FAQ FAQ RSS

支持168: Amazon Ebay Amazon(Canada)
Half


Post new topic Reply to topic  [ 21 Posts ]  Go to page Previous  1, 2
Author Message
 Post subject: Re: 贝叶斯,online learning
PostPosted: 3/10/16 10:15 
Offline 模拟帐户

Joined: 6/5/13 07:12
Posts: 1656
请教一下: 禅师你说的这种一堆features, 加上几个目标做统计建模的过程,方法有好多。 bias高的方法:各种regression,lasso,PLS,PCA 什么的。 variance高的方法: SVM, NN之类的, 具体应该怎么选择?每个都来试一下? 另外,如果截取的都是同一段时间内的,observation之间的相关性很高,不符合iid,该怎么办?
野狐禅 wrote:
sensor wrote:
贝叶斯方面的东西,尤其是和online learning有关的内容很有意思a,感觉可以基于贝叶斯的思想建立一些有用的模型。
市场的模型要讲究所谓的context, 目前是range 还是trend, 这个每个人大概会有个判断。 一只股票,假设我们只做多。 如果昨天的收盘价>开盘价,那么,今天一开市,我们发现开盘后跳空高开(这个是我们观察到的information),问今天收盘价大于开盘价的概率是多少? 即求P(今天收盘价格>开盘价格|今天跳空高开)。
我们要先知道 P(今天收盘价>开盘价) 和P(今天收盘价<开盘价),在贝爷四中对应的就是prior distribution。根据当前是range, trend,昨天涨没涨,给出一个大概的概率估计,这个prior distribution要用历史数据进行trainning。
根据新的information(跳空高开), 来weight我们的prior distribution. 这就需要计算likelyhood: P(今天跳空高开|今天收盘价>开盘价) 与 P(今天跳空高开|今天收盘价<开盘价), 这两个likehood的计算也可以根据历史价格进行training。
根据贝叶斯公式就可以计算了: P(今天收盘价>开盘价|今天跳空高开)=P(今天跳空高开|今天收盘价>开盘价)*P(今天收盘价>开盘价)/[P(今天跳空高开|今天收盘价>开盘价)*P(今天收盘价>开盘价)+P(今天跳空高开|今天收盘价<开盘价)*P(今天收盘价<开盘价)]
online learning的关键是要不停的update prior distribution,具体怎么update。。。写不下去了。。。

你是说对于每一过去情况,做出一个判断,如有以下变量及其取值:
趋势:range, up-trend, down-trend
跳空:y, n
收盘>开盘:y, n
...
然后有一个目标,如“明天”,取值:涨、跌,即一个概率模型,
P(明天 | 趋势,跳空,收盘>开盘, ...)

这样的东西,老和尚在做高频对冲的时候做过,实时更新,用来预测下一个 tick 的价位。一般对错的频率约为 55:45。由此降低的交易代价相当于帮公司省下 quant 和 it 部门的钱。


 
 Profile  
Reply to topic 
 Post subject: Re: 贝叶斯,online learning
PostPosted: 3/10/16 10:24 
Offline 模拟帐户

Joined: 6/5/13 07:12
Posts: 1656
feature之间相关性高好解决,用降个维什么的,observation之间相关性高就有点儿恶心了,我能想到的只有heage了。
另外,股票数据属于时序数据,做建模的过程中和处理传统高维度data set有什么区别?需要注意什么?


 
 Profile  
Reply to topic 
 Post subject: Re: 贝叶斯,online learning
PostPosted: 3/10/16 11:25 
Offline 模拟帐户

Joined: 8/23/06 20:38
Posts: 3006
sensor wrote:
这种一堆features, 加上几个目标做统计建模的过程,方法有好多。 bias高的方法:各种regression,lasso,PLS,PCA 什么的。 variance高的方法: SVM, NN之类的, 具体应该怎么选择?每个都来试一下? 另外,如果截取的都是同一段时间内的,observation之间的相关性很高,不符合iid,该怎么办?

这几天出风头的 google 围棋,就是不假设 iid 的。

在高频环境下,市场大约两小时内就能转性。你上面提的那些方法,都是离线学习,应该没有一个能行的,除非发现稳态变换方法,但这又不合逻辑。


 
 Profile  
Reply to topic 
 Post subject: Re: 贝叶斯,online learning
PostPosted: 3/10/16 12:33 
Offline 模拟帐户

Joined: 6/5/13 07:12
Posts: 1656
是的,其实我觉得离线学习的关键应该是feature selection了。否则就是garbage in garbage out 了。 但是目前还是有很多可以挖掘的地方的。 在线学习的话,蛮符合市场的“context”变化一说,可惜还没有深入研究过。只是在看贝叶斯方面内容的时候书上提到了一些,感觉很有意思, 才发了这个帖子:)
野狐禅 wrote:
sensor wrote:
这种一堆features, 加上几个目标做统计建模的过程,方法有好多。 bias高的方法:各种regression,lasso,PLS,PCA 什么的。 variance高的方法: SVM, NN之类的, 具体应该怎么选择?每个都来试一下? 另外,如果截取的都是同一段时间内的,observation之间的相关性很高,不符合iid,该怎么办?

这几天出风头的 google 围棋,就是不假设 iid 的。

在高频环境下,市场大约两小时内就能转性。你上面提的那些方法,都是离线学习,应该没有一个能行的,除非发现稳态变换方法,但这又不合逻辑。


 
 Profile  
Reply to topic 
 Post subject: Re: 贝叶斯,online learning
PostPosted: 4/8/16 00:22 
Offline 模拟帐户

Joined: 10/13/13 00:24
Posts: 29
美女,实战情况怎么样了?
貌似这个板块也就你我还在努力挖坑,其他的都去逍遥了。


 
 Profile  
Reply to topic 
 Post subject: Re: 贝叶斯,online learning
PostPosted: 4/8/16 12:01 
Offline 模拟帐户

Joined: 8/5/07 20:13
Posts: 40600
I am trying very hard, but have not find a door to get into.

PM 金宝,这厮不理我啊,难道跟雪太一样foe我?


 
 Profile  
Reply to topic 
Display posts from previous:  Sort by  
Post new topic Reply to topic  [ 21 Posts ]  Go to page Previous  1, 2

Home 


Who is online

Users browsing this forum: No registered users and 2 guests


You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot post attachments in this forum

Search for:

Batch Generator
Hutong9 SizzlingStock GaoFamily  Hearty  TT  股通 财籽 GrusInvest E.T. Yahoo Google msn 大千 未名 外汇牛人邦 CNFinance 华人 investern optionpain YangCai 司空金融网


This site is mainly for stock market discussion, it does not provide any investment advice. It is not suggested to rely on posts here for investment decision.
本网站主要作为股市讨论用途,并不提供任何投资建议。请不要将本站内容作为投资依据,否则风险自负。

钱多多股票论坛 - Trader1688.com© Powered by phpBB © 2002, 2006 phpBB Group