小白自學量化交易之萬礦課程筆記---股票多因子策略初階
阿新 • • 發佈:2018-11-15
-
小白自學量化交易之萬礦課程筆記—股票多因子策略初階
-
Pandas.read_cav() 官方文件
pandas.read_csv(filepath_or_buffer, sep=', ', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None , false_values=None, skipinitialspace=False, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, iterator=False, chunksize=None, compression= 'infer', thousands=None, decimal=b'.', lineterminator=None, quotechar='"', quoting=0, escapechar=None, comment=None, encoding=None, dialect=None, tupleize_cols=None, error_bad_lines=True, warn_bad_lines=True, skipfooter=0, doublequote=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision= None)
index_col : int or sequence or False, default None
Column to use as the row labels of the DataFrame. If a sequence is given, a MultiIndex is used. If you have a malformed file with delimiters at the end of each line, you might consider index_col=False to force pandas to _not_ use the first column as the index (row names)
用作行索引的列編號或者列名;取值可以有整數、序列、False、None;
如果給定一個序列(sequance),則採用多級索引(multiindex);
index_col=[0,1]指定檔案的第一、二列為索引列。
表示多級索引,index的多層形式,多級標籤用字典來表示。詳解1 詳解2
多級索引前提下,獲取level級索引下的返回向量。標準文件 IT邦
numpy.unique(ar, return_index=False, return_inverse=False, return_counts=False, axis=None)
表示對陣列或列表去重,return_index=True表示返回去重後元素在原陣列中所佔的位置。
去掉噪音,避免對因子的整體分佈造成影響。有兩種:平均絕對離差法(MAD:MeanAbsoluteDeviation,以均值+n*MAD為邊界)、標準差法(Std)。
完成去極值後再對資料進行標準化,實現量綱一致,有普通標準化和行業標準化。
wa.prepare_raw_data() | 獲取原始因子資料 |
---|---|
wa.process_raw_data() | 資料處理 |
wa.ic_analysis() | 因子分析 |
wa.add_group() | 分組函式 |
wa.return_anlysis() | 收益率分析函式 |
wa.turnover_analysis() | 換手率分析 |
wa.sector_analysis() | 選股結果分析函式 |
IC:當期因子值與下一期收益率之間的相關性,相差一個週期。
IC訊號衰減:當前因子與相差LAG期收益率之間的相關性。
LAG:
因子分析-換手率分析:
------------------------------->個數法:每期之間股票變動的數量/股票總數。
------------------------------->權重法:在個數考量的基礎上,考慮了權重。
買入訊號衰減:已買入的股票在後續調倉中繼續買入的比率。
買入訊號反轉:當前買入的股票在後續調倉期賣出的比率。
未完待續…