1200字范文 > 快牛策略的均值回归进阶策略股票价格抓反弹的时候666的很啊！代码均为Python

快牛策略的均值回归进阶策略股票价格抓反弹的时候666的很啊！代码均为Python

时间：2020-12-05 06:10:11

我们经常在抓反弹时感觉像在抓一只刺猬，不知道该怎么下手。左侧交易会不会买在半山腰？右侧交易会不会进场太晚？什么时候买入真是让人头疼。切莫苦恼，你完全可以通过历史数据统计判断反弹的时机。今天公众号给大家介绍一种简单的统计方法，它不能保证抓反弹次次成功，但可以让你对多错少，累积起来就是真实的收益！

动机

股票的价格会以它的均线为中心进行波动。也就是说，当标的价格由于波动而偏离移动均线时，它将调整并重新归于均线。那么如果我们如果能捕捉偏离股价的回归，就可以从此获利。本篇要讲的是，统计历史数据中价格偏离所对应的反弹幅度，选择胜率最高的偏离度作为入场信号。

波动大小的相对性

举实例来说。下图是某支股票的 60 分钟线，中间紫色曲线为股价的 5 日均线。可以看出在蓝色线段标明的时间里，股价波动平缓。在两个粉色箭头处，股价比均线分别高 4.1% 和低 5.9%。这些波动较前段时间更为剧烈，可以告诉我们股价发生了偏离。

再看下图，这是同一支股票在另一段时间的 60 分钟线。这段时间里价格波动幅度大，在粉色箭头的位置，价格和均线的差距分别为5.3% 和 5.1%，但我们不将其视为显著的价格偏离。

标准差

标准差（standard deviation），通常用小写希腊字母 σ（sigma，读“西格玛”）表示。通俗地讲，一组数据的标准差就是这组数据离均值的普遍差距。标准差的计算公式为

如果这组数据的波动较大，那么 σ 相应也会较大；相反的，如果这组数据波动小，那么 σ 会更接近零。

举例来说，假设我们有一组数据 A=(1,0,0,0,0−1,0,0,0,0)，如下

它的平均值是 0，标准差是

‍‍这时如果下一项出现的数据是x11=1，可以算出它和均值的差是2.23倍标准差，可以被视为是一个较大的波动。

在另一种情况里，假设我们的数据是 B=(1,−1,1,−1,1,−1,1,−1,1,−1)如下图

可以直观地看出波动较大。这组数据同样是均值等于0，它的标准差是

‍‍‍‍‍明显比数据 ‍‍‍‍A的标准差更大。这时如果出现新的数据 x11，由于它和均值的差距等同于标准，我们不认为它是一个很大的波动。

有了这个概念，我们可以构造一种利用标准差来测量当日股价波动幅度的方法。取过去N天收盘价，并取其标准差 σ，设今日股价为P并且N日日均线值为MAN

这个值得含义是，相较过去N天的价格，今日股价与均值的偏差为 ρ倍的标准差。如果绝对值ρ比较大，我们判定今日价格波动比历史波动更为突出；反之绝对值ρ比较小，我们判定今日的波动很普通，就叫它“N日偏离倍数”。

偏离倍数和赢输的统计

我们没法凭空预测偏离倍数在多大的情况下价格会反弹，也不能盲目地认为偏离倍数越高越好。我们干脆穷举，对历史上所有的偏离倍数（范围），统计其后后股价的走势，然后将胜率最高的偏离倍数视为入场信号，在其出现时买入。

‍‍

统计的对象

现代金融理论认为，证券价格的时间序列在大部分时间服从随机游走，但是在一些特定的时刻（比如基本面发生变化，或者供需关系发生变化），价格序列会偏离随机游走，并且选择向上或者向下的方向。当价格在脱离随机游走时，通常都会产生一些现象或征兆，就是我们常说的“信号”，如果我们捕捉到这些信号，就可以赚取收益。

我们使用利用股票的历史数据计算各种各样的指标（比如MACD，RSI），就是为了通过指标的数值来判断是否出现信号。但很多时候指标的使用是粗糙并且模糊的，比如“当RSI低于20时买入”是一个发出信号的标准，但为什么是20呢？18或者22会不会效果更好？我们想通过历史统计来分析这个问题，那么进行统计的对象就有两个：指标出现的数值，以及出现该数值之后的涨跌结果。

指标

一般而言，一支股票的指标是一个函数Ind(T)，它输入的是时间T（确切地说还有时间T之前的所有股票数据），返回的是在那个时间点的指标数值。比如说，我们要考量的指标是过去5天的收益率，那么指标的输出就是今日收盘价除以五天前收盘价的商再减1。

结果

结果指的就是，我们认为指标所预测的事件到底有没有发生，由此把结果分为“赢”、“平”和“输”。举例来说，假设我们认为过去5天的收益率越高，未来两天的收益率就越大；那我们要观测的结果就是未来两天交易量的情况，如果未来两天的平均交易量大于今天的110%，就记作“赢”，小于今天的100%就记作“输”，其余情况记作“平”。这里“赢平输”的计算标准有一定拍脑袋的成分，这么做的缺点就是统计的数据不全面，优点是结果更直观更方便应用，并且如果统计结果不理想，我们可以更改输赢的决定方法再重新来过。

指标和结果的统计

数据统计

一、提取历史所有交易日的股票数据，并去掉停牌日的信息；

二、记录每一天的指标和输赢结果。对于每一个不停牌的交易日T，做：

a. 计算当日的指标Ind(T)，方便统计需要，四舍五入到合适的小数点位；

b. 计算从T日起观测的输赢结果；

c. 记录事件组(Ind(T),赢或平或输)。

三、统计指标的某个值出现后赢和平和输分别发生过多少次。

举例个简单的例子。假设我们认为过去5天涨得越多则未来五天越可能跌。那么把五日收益率设为指标；未来第五天收盘价小于今日收盘价则记为赢，大于记输，等于则记平。

首先收集数据，注意要把停牌时的数据去掉，这里是从06年2月2日到2月2日。

prices = get_price('002200.XSHE', start_date="-02-02", end_date="-02-02", frequency='daily', fields=['close'], skip_paused=True)['close']import pandas as pddef get_stats(prices):# 设置一个计数器i = 5# 设置一个空listdata = [] # 从第一个到倒数第二个价格while i < len(prices)-4: # 计算五日收益率，留小数点后2位ratio = 0.01 * ((prices[i]/prices[i-5]) //0.01) # 如果第五天收盘价更低if prices[i+4] < prices[i]: # 那结果记赢result = 'win'# 如果第五天收盘价更高if prices[i+4] > prices[i]: # 结果记输result = 'lose'# 收盘价不变的话if prices[i] == prices[i+4]: # 记平result = 'even'# 看看该比例有无记载过ratio_recorded = False# 翻看datafor data_dict in data: # 如果比例被记载过if data_dict['value'] == ratio:# 那就好，更新输赢data_dict[result] += 1# 记载过为是ratio_recorded = True# 如果翻完了发现没记载过，if ratio_recorded == False: # 那么就记载下来data_dict = {'value':ratio, 'win':0, 'lose':0, 'even':0}data_dict[result] += 1data.append(data_dict) # 别忘更新ii += 1# 转换成DataFramedf = pd.DataFrame(data, columns=['value', 'win','even', 'lose']) # 按照value列从小到大排序df = df.sort(['value'], ascending = True)return(df)

制图

把统计好的数据画出来就可以看出效果了。基于以上数据的特性，我们要画一个叠加条状图。该图的x坐标轴是指标的值，y轴则是该指标值出现的次数，并按颜色划分成“赢平输”叠加的条状图。代码如下：

Import matplotlib.pyplot as plt# 设置图的大小fig_size = plt.rcParams["figure.figsize"]fig_size[0] = 15fig_size[1] = 10# 把统计的DataFrame中竖列抽出来values = stats['value']wins = stats['win']evens = stats['even']loses = stats['lose']# 画输的数目，颜色为红p1 = plt.bar(values, loses, width = 0.008, color='r')# 画平的数目，颜色为黄，底部在输之上p2 = plt.bar(values, evens, width= 0.008, bottom = loses, color='y')# 画赢的数目，颜色为绿，底部在输+平之上p3 = plt.bar(values, wins, width=0.008, bottom = evens+loses, color='g')# 标注坐标轴和注释plt.ylabel('输赢结果',size = 15)plt.xlabel('收盘价除以22',size = 15)plt.legend((p1[0], p2[0],p3[0]), ('输', '平','赢'))

这样就可以清晰地看到一些规律。

合理地使用统计结果

我们单单把图画了出来，那是不是就可以在策略中用了？当然不是。拿之前的统计举例，可以看见两个比较明显的问题

先看紫色标注的位置，那里统计的胜率很高。如果们选择在5日收益率1.17时买入，会怎么样？首先5日收益率正好为1.17的概率很小，可能若干年都不出现信号。其次，可以看见它右边的1.18的胜率并不高，那么实际上当指标计算出为1.175时就无法合理判断。

再看棕色框起的区域，这里只有赢没有输，但是这个区域中样本量太小了，完全无法保证统计结果的准确性。

选择胜率最高的区间

一个可行的解决办法，是设定一个指标区间的宽度w，并且设定最低数据比θ。如果一个宽度为w的x轴区间里的数据量占总数据量的θ以上，我们就计算并记录该区间里的输赢比；如果区间内数据比例少于θ，我们则抛弃该区间。最后选出输赢比最高的区间作为产生信号的指标值。

比如我们设w=4，那么在1.08到1.11的区间里，赢输比为66:58。

我们要选的是依照该计算方法得到的赢输比最高的区间。

下面函数的4个输入分别为：

statistics – 之前算出的DataFrame统计数据

tick_width – 指标值的最小间隔（跳动值，比如上面的示例里就是0.01）

least_percentage – 要求区间数据量至少有总数据量的多少

band_width – 区间的宽度，整数，可理解为进行多少次tick_width的跳动。

代码如下

#返回一Series，内容 low=区间低点，high=区间高点，ratio=区间赢输比def find_best_region(statistics, tick_width, least_percentage, band_width):# 取出统计df的列values = statistics['value']loses = statistics['lose']wins = statistics['win']evens = statistics['even'] # 算总数据量num_data = sum(wins) + sum(loses) + sum(evens) # 起始一listmydata = [] # 计算指标统计出的最低值除以间距，取整数，方便后面移动计算。low_bound = int(statistics['value'].iloc[0]/tick_width) # 计算指标统计出的最高值除以间距，减去区间宽度high_bound = int(statistics['value'].iloc[-1]/tick_width - band_width + 1) # 对于上限和下限之间的所有整数for n in range(low_bound, high_bound ): # 选取统计中所对应的区间statistics1 = statistics[values >= float(n)*tick_width]stat_in_range = statistics1[values <= float(n + band_width - 1) * tick_width] # 计算区间中的赢输比。输数加一，避免除以零。ratio = float(sum(stat_in_range['win'])) / float(sum(stat_in_range['lose'])+1) # 计算区间中数据量range_data = float(sum(stat_in_range['win']) + sum(stat_in_range['lose']) + sum(stat_in_range['even'])) # 如果区间数据量除以总数据量大于最低数据比if range_data / num_data >= least_percentage: # 记录区间的最低值，最高值，和区间内的赢输比mydata.append({'low': float(n) * tick_width, 'high': float(n+band_width) * tick_width, 'ratio': ratio}) # 制作DataFramedata_table = pd.DataFrame(mydata) # 按照赢输比排序sorted_table = data_table.sort('ratio', ascending = False) # 返回第一行return(sorted_table.iloc[0])

对于上面的例子，tick_width = 0.01，再设 least_percentage = 0.03，以及 band_width = 4，计算

find_best_region(stats,0.01, 0.03, 4)

得到区间[1.12,1.16]，区间内输赢比1.43。

把所有的宽度都计算一遍。做法就是，先固定一个最短的宽度w_0，对于所有宽度为w_0的区间进行上面的计算，然后将宽度换为w_0+1再重复一遍，然后是w_0+2，以此类推，直到达到了设定的最大宽度。最后取这个过程中算出的最大的输赢比，并取相应的区间。

具体的计算已经由上面的函数完成，现在只要再包装一个函数来迭代地以不同的宽度呼出上面的函数，得到每个长度的最佳区间，再从这里面选出胜率最好的。

这里输入的statistics，tick_width，least_percentage和之前相同，另外的两个输入是

least_width – 最短的区间宽度

most_width – 最大的区间宽度

代码

#返回一Series，内容 low=区间低点，high=区间高点，ratio=区间赢输比def find_absolute_best_region(statistics, tick_width, least_percentage, least_width, most_width):# 创建标注列的空DFcolumns = ['low', 'high', 'ratio']df = pd.DataFrame(columns = columns) # 对于所有在最短和最长标准之间的宽度for band_width in range(least_width, most_width + 1): # 运行上面函数，得到该宽度的最佳区间best_width_region = find_best_region(statistics, tick_width, least_percentage, band_width) # 将结果加入DFdf = df.append(best_width_region, ignore_index = True) # 将赢输比从大到小排列sorted_table = df.sort('ratio', ascending = False) # 返回第一行return(sorted_table.iloc[0])

还是同样的例子，这次least_percentage选0.05，最小宽度least_width=2，最大宽度most_width=30。然后

find_absolute_best_region(stats, 0.01, 0.05, 2, 30)

得到宽度为19的区间[1.12,1.31]，这之间的赢输比为1.72，这也是使用该指标时保证5%数据量的情况下的最大赢输比！

偏离倍数和赢输的统计

按照文中的思路，我们要计量的指标是上一节中介绍的 N 日偏离倍数 ρ。另外，我们只记录 ρ小于-1和大于等于-1，那说明价格偏离不大，则不构成回归信号。

以某股票从年到年的数据为例，统计结果如下：

我们设置参数：区间宽度最小数据比w=5，C塔=0.05，通过计算，得到区间为[-2.6,3.1]，区间数据如下：

也就是说，根据历史统计，如果当偏离倍数在-3.1和-2.6之间时买入该股票，输赢的预期是27:12，还有2次平局。

回测

其实策略的主要部分已经完成，只要加上对资金和仓位的管理，就可以构成一个可运行的策略。这里我们就构建一个很简单的方案。

设定如上一节所述每的参数：均线天数N，统计输赢天数T，止盈倍数u，止损倍数d，区间宽度w，和最小数据比Cta。每交易日执行以下操作：

一、全仓卖出应当止盈或止损的股票，或持有超过 T天的股票；

二、执行上一节的统计方法来更新每一支股票的最佳偏离倍数区间；

三、如果空仓，选定任意一支偏离倍数在最佳区间内的股票并全仓买入，如果所有股票都不符合则空仓。买入时记录止盈线u倍和止损d倍，并且设如果T日内未触碰止盈或止损线，也全部卖出。

来看一看回测结果。以下回测使用的股票池只包含 1 或 2 支标的股，这样便于看出策略对于个股发出的信号。文章最后的策略代码只适用于小规模的股票池；对于更大的股票池，信号会更加密集，因此需要调整每支股票的持仓量并且分别止盈止损，读者可以自行进行修改，或等待量化课堂未来的文章。另外，我们的回测从年开始，这样保证回测开始时就有一定的历史数据储备。

结语

首先是均值回归核心思路：

价格偏离均线太多就会弹回来

然后是，我们怎么判断偏离多少呢？

价格减去均线除以历史波动的标准差可以丈量偏离的程度

判断入场的话…

利用历史统计的偏离倍数对应的输赢率判断入场时机

最后还要指出，本篇文章旨为抛砖引玉，展示一种思路。文中的统计方法比较粗糙，策略也比较简单。想要在实战中应用的话，还需要进一步拓展、打磨并结合其他的方法，才能构造出一套成熟的交易策略。

部分核心代码

mydata = [] # 在所有位置不会溢出的位置for n in range(min(values), max(values) - (g.band_width-1)): # 取在n和（n+宽度）之间的DF行stat_in_range = statistics[(values >= n) & (values <= n+g.band_width-1)] # 赢除输（这里输+1，因为可能输=0）ratio = float(sum(stat_in_range['win'])) / float((sum(stat_in_range['lose']) + 1)) # 这区间数据总量range_data = float(sum(stat_in_range['win']) + sum(stat_in_range['lose']) + sum(stat_in_range['even'])) # 如果数据量超过预设的临界值if range_data / num_data >= g.least_percentage:# 记录区间的输赢比mydata.append({'low': n, 'high': n+g.band_width, 'ratio': ratio}) # 区间统计转换成DFdata_table = pd.DataFrame(mydata) # 按输赢比排序sorted_table = data_table.sort('ratio', ascending = False) # 取第一行stock_best_range = sorted_table.iloc[0]stock_best_ranges[security] = stock_best_range # 输出结果return(stock_best_ranges)# --代码块11.# 获取买入信号# 输出一list该买入的股票def buy_signals(stock_best_ranges, context):to_buy = [] for security in g.security:stock_best_range = stock_best_ranges[security] # 看现价current_price = attribute_history(security,1, '1d', 'close').iloc[0,0] # 取倍数区间低点low = float(stock_best_range['low']) # 取倍数区间高点high = float(stock_best_range['high']) # 取赢率ratio = float(stock_best_range['ratio']) # 获取历史收盘价h = attribute_history(security, g.ma_length, '1d', ['close'], skip_paused=True)['close'] # 计算均线ma = mean(h) # 计算标准差sigma = std(h) # 算现价的偏离倍数times_sigma = (current_price - ma) / sigma # 如果在该买的区间里if low <= 10 * times_sigma and 10 *times_sigma <= high: # 加入买入列表to_buy.append(security) return(to_buy)# --代码块12.# 获取卖出信号# 输出一list该卖出的股票def sell_signals(context): to_sell = [] # 对于仓内所有股票for security in context.portfolio.positions: # 取现价current_price = history(1, '1m', 'close', security).iloc[0,0] # 查卖出条件conditions = g.sell_conditions[security] # 看看是不是该卖了if current_price >= conditions['high'] or current_price <= conditions['low'] or conditions['days'] <= 0: # 加入卖出信号，确保没有重复to_sell.append(security) # 如果不需要卖else: # 日数减1g.sell_conditions[security]['days'] -= 1return(to_sell)# ---代码块13.# 卖出函数def sell_stocks(to_sell, to_buy, context):for security in to_sell: # 如果也在买入名单里if security in to_buy: # 从卖出信号中删掉pass# 不该买的话else: # 全卖掉order_target(security, 0) # 如果没有卖干净呢if security in context.portfolio.positions:# 把天数清零g.sell_conditions[security]['days'] = 0# ---代码块14.# 买入函数def buy_stocks(to_buy, context):# 有多少钱cash_per_stock = context.portfolio.portfolio_value if len(context.portfolio.positions) == 0: # 对于所有买单里的股票for security in to_buy:order_value(security, cash_per_stock) if security in context.portfolio.positions:# 看现价current_price = attribute_history(security,1, '1d', 'close').iloc[0,0]# 获取历史收盘价h = attribute_history(security, g.ma_length, '1d', ['close'], skip_paused=True)['close']# 计算均线ma = mean(h)# 计算标准差sigma = std(h)# 止损线low = current_price - g.loss_times_sigma * sigma# 止盈线high = current_price + g.profit_times_sigma * sigma# 在全局变量中记录卖出条件g.sell_conditions[security] = {'high': high, 'lo

本内容不代表本网观点和政治立场，如有侵犯你的权益请联系我们处理。

网友评论

网友评论仅供其表达个人看法，并不表明网站立场。

快牛策略的均值回归进阶策略 股票价格抓反弹的时候666的很啊！代码均为Python

快牛策略的均值回归进阶策略股票价格抓反弹的时候666的很啊！代码均为Python