在backtrader中,数据通常通过adddatafeed的方式输入至cerebro中,然后用户在自定义的stragety的子类(即自定义策略)中进行数据处理。传入数据一般具有一些固定格式,这些格式通常通过定义特定数据文件格式的子类来规定如:
class GenericCSVData(feed.CSVDataBase):
params = (
('nullvalue', float('NaN')),
('dtformat', '%Y-%m-%d %H:%M:%S'),
('tmformat', '%H:%M:%S'),
feed.CSVDataBase 是backtrader 中定义的处理csv文件的基类。因此,传入backtrader中的数据通可以指定既可以作为整体进行处理,也可以通过指定open,high等属性来对特定数据进行处理。
strategy子类中的数据
backtrader 中的数据流,一般为Data Feed,包括 :
•通过cerebro.adddata导入的原始数据
•Indicator对象
•通过自定义方法处理后的数据结果,等等
在 init 方法中,常用到几种数据对象:
•self.datas:通过cerebro.adddata方法 传入的所有数据
•self.dataX=self.datas[X] 指第X+1个被传入strategy的数据,X=0,1,2...
•self.data=self.data[0] 指第一个被传入的数据(当初始化indicator时,不指定数据来源,则默认传入首个数据)
同时,这些数据又常常可作为backtrader独特的数据对象格式:lines。根据backtrader文档,lines被定义为一个数组,数组中的数据作图时形成一条曲线。
It can hold one of more line series, being a line series an array of values were the values put together in a chart they would form a line.
lines 对象都有自己的名称且有的自身的属性,这些属性一般在数据类中已经进行了声明:
•可以通过self.lines(或self.l), self.lines.name(或self.lines_name)来对line对象进行取值
•self.dataX也可以被视为line对象,包括了datetime, open ,close, high ,low ,volume等属性。这些属性在对传入数据进行格式化时已经定义。
•Inidcator对象在定义时,就得为自己line对象进行命名,比如:
class SimpleMovingAverage(Indicator):
lines = ('sma',)
•在对复杂对象(Strategy或 Indicator)中的line对象中的数据进行获取时,通常通过self.data_name或者self.datax_name的方式。
line对象处理
line对象处理时有以下几点需要注意:
•datafeed对象可以通过self.dataX.close, self.dataX.open的方式来获取收盘价、开盘价这些本身的属性值。而Indicator 对象是没有这些属性的,因此Indicator对象中定义的line,一般还是通过self.l.lines来获取。
•当多个line被同一个对象定义时,可以按定义的顺序通过self.l.lines[X], self.l.linesX, self.l.lines_X的方式来获取第X+1个line。
•line包含的数据长度可以通过python中的len方法获得。
•line对象通过回溯方式来输出数据,如:
def next(self):
if self.data.close[0] >self.data.close[-1]:
print('Closing price is higher today')
•这个例子中,比较的是收盘价与前收的大小,[-1]指line序列中以当前为起点的上一个数据。以此类推,可通过[x]的方法来获取以当前为起点x个以前的数据值。因此,不同于python中正常的array,line没有python中常用的切片方式。
•line对象通过get方法进行数据切片:
myslice = self.my_sma.get(ago=-1, size=10)
•ago指回溯起点,size指切片大小。
以上这些要均在backtrader文档中的Platform Concepts[1]中有详细介绍
References
[1] Platform Concepts: https://www.backtrader.com/docu/concepts/
ancova()提供了协方差分析计算,调用方式是:ancova(formula, data.in=sys.parent(), x, groups)
实例:为研究ABC三种饲料对猪的催肥效果,每种饲料养8头猪一段时间,测得每头猪的初始重量(X)和增重(Y),分析三种饲料对猪的催肥效果是否相同?
>#建立数据集
>feed <- rep(c("A", "B", "C"), each=8)
>Weight_Initial <- c(15,13,11,12,12,16,14,17,17,16,18,18,21,22,19,18,22,24,20,23,25,27,30,32)
>Weight_Increment <- c(85,83,65,76,80,91,84,90,97,90,100,95,103,106,99,94,89,91,83,95,100,102,105,110)
>data_feed <- data.frame(feed,Weight_Initial,Weight_Increment)
>anova(lm(Weight_Increment~Weight_Initial+feed), data=data_feed)
Analysis of Variance Table
Response: Weight_Increment
Df Sum Sq Mean Sq F value Pr(>F)
Weight_Initial 1 1621.12 1621.12 142.445 1.496e-10 ***
feed 2 707.22 353.61 31.071 7.322e-07 ***
Residuals 20 227.61 11.38
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
>anova(lm(Weight_Increment~Weight_Initial*feed), data=data_feed)
Analysis of Variance Table
Response: Weight_Increment
Df Sum Sq Mean Sq F value Pr(>F)
Weight_Initial 1 1621.12 1621.12 162.4949 1.897e-10 ***
feed 2 707.22 353.61 35.4443 5.726e-07 ***
Weight_Initial:feed 2 48.04 24.02 2.4076 0.1184
Residuals 18 179.58 9.98
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)