最近在整理历史数据用于回测的时候,发现有一些其它平台存在的数据在集思录不存在,数据的占比还不少,整理如下:
1、一些已经退市的数据缺失,例如国泰定01 (110803.SH), 国泰定02 (110804.SH),17伏泰转(145901.SH)等。 这些转债的存在在雪球是可以查到存在的,单纯用集思录的数据做回测的话,会带来一定的误差。
2、2010年以前退市的数据不存在。这个倒是无所谓的,回测也不会使用到的。
整理历史数据太麻烦了,不过细节决定成败,加油!
1、一些已经退市的数据缺失,例如国泰定01 (110803.SH), 国泰定02 (110804.SH),17伏泰转(145901.SH)等。 这些转债的存在在雪球是可以查到存在的,单纯用集思录的数据做回测的话,会带来一定的误差。
2、2010年以前退市的数据不存在。这个倒是无所谓的,回测也不会使用到的。
整理历史数据太麻烦了,不过细节决定成败,加油!
0
wfisher - 时不我待
结合了jisilu的数据和tushare的数据,发现两边数据对不太上,总体来说jisilu确实更好一些。
1、tushare存在一些问题的case,例如这两条:
ts_code trade_date pre_close open high low close change pct_chg vol amount
113624.SH 20211006 103.45 103.39 103.48 103.39 103.48 0.03 0.0290 3.0 0.3104
127034.SZ 20211006 104.12 104.11 104.11 104.11 104.11 -0.01 -0.0096 1.0 0.1041
10月6号明显是不开盘的,这点jisilu的数据更好一些;
2、在集思录上,128048和113533在2019-07-24有交易数据,而tushare没有。
截止到11月25号,集思录历史交易总数据条数大概在31.94万,有40条左右tushare是缺失的,这个差距应该是可以接受的。可以继续来做数据融合。
1、tushare存在一些问题的case,例如这两条:
ts_code trade_date pre_close open high low close change pct_chg vol amount
113624.SH 20211006 103.45 103.39 103.48 103.39 103.48 0.03 0.0290 3.0 0.3104
127034.SZ 20211006 104.12 104.11 104.11 104.11 104.11 -0.01 -0.0096 1.0 0.1041
10月6号明显是不开盘的,这点jisilu的数据更好一些;
2、在集思录上,128048和113533在2019-07-24有交易数据,而tushare没有。
截止到11月25号,集思录历史交易总数据条数大概在31.94万,有40条左右tushare是缺失的,这个差距应该是可以接受的。可以继续来做数据融合。