用Python做股市資料分析（一）

阿新 • • 發佈：2019-01-16

AAPL	GOOG	MSFT
Date
2016-01-04	1.000000	1.000000	1.000000
2016-01-05	0.974941	1.000998	1.004562
2016-01-06	0.955861	1.002399	0.986314
2016-01-07	0.915520	0.979173	0.952007
2016-01-08	0.920361	0.963105	0.954927

Python

stock_return.plot(grid = True).axhline(y = 1, color = "black", lw = 2)

1	stock_return.plot(grid=True).axhline(y=1,color="black",lw=2)

png

這個圖就有用多了。現在我們可以看到從我們所關心的日期算起，每支股票的收益有多高。而且我們可以看到這些股票之間的相關性很高。它們基本上朝同一個方向移動，在其他型別的圖表中很難觀察到這一現象。

我們還可以用每天的股值變化作圖。一個可行的方法是我們使用後一天$t + 1$和當天$t$的股值變化佔當天股價的比例：

$text{growth}_t = frac{text{price}_{t + 1} - text{price}_t}{text{price}_t}$

我們也可以比較當天跟前一天的價格：

$text{increase}_t = frac{text{price}_{t} - text{price}_{t-1}}{text{price}_t}$

以上的公式並不相同，可能會讓我們得到不同的結論，但是我們可以使用對數差異來表示股票價格變化：

$text{change}_t = log(text{price}_{t}) - log(text{price}_{t - 1})$

(這裡的 $log$ 是自然對數,我們的定義不完全取決於使用 $log(text{price}_{t}) - log(text{price}_{t - 1})$ 還是 $log(text{price}_{t+1}) - log(text{price}_{t})$ .) 使用對數差異的好處是該差異值可以被解釋為股票的百分比差異，但是不受分母的影響。

下面的程式碼演示瞭如何計算和視覺化股票的對數差異：

Python

# Let's use NumPy's log function, though math's log function would work just as well
import numpy as np
 
stock_change = stocks.apply(lambda x: np.log(x) - np.log(x.shift(1))) # shift moves dates back by 1.
stock_change.head()

12345

# Let's use NumPy's log function, though math's log function would work just as wellimportnumpy asnpstock_change=stocks.apply(lambdax:np.log(x)-np.log(x.shift(1)))# shift moves dates back by 1.stock_change.head()

AAPL	GOOG	MSFT
Date
2016-01-04	NaN	NaN	NaN
2016-01-05	-0.025379	0.000997	0.004552
2016-01-06	-0.019764	0.001400	-0.018332
2016-01-07	-0.043121	-0.023443	-0.035402
2016-01-08	0.005274	-0.016546	0.003062

Python

stock_change.plot(grid = True).axhline(y = 0, color = "black", lw = 2)

1	stock_change.plot(grid=True).axhline(y=0,color="black",lw=2)

png

你更傾向於哪種轉換方法呢？從相對時間段開始日的收益差距可以明顯看出不同證券的總體走勢。不同交易日之間的差距被用於更多預測股市行情的方法中，它們是不容被忽視的。

移動平均值

圖表非常有用。在現實生活中，有些交易人在做決策的時候幾乎完全基於圖表（這些人是“技術人員”，從圖表中找到規律並制定交易策略被稱作技術分析，它是交易的基本教義之一。）下面讓我們來看看如何找到股票價格的變化趨勢。

一個q天的移動平均值（用 $MA^q_t$ 來表示）定義為：對於某一個時間點t，它之前q天的平均值。

$MA^q_t = frac{1}{q} sum_{i = 0}^{q-1} x_{t - i}$

移動平均值可以讓一個系列的資料變得更平滑，有助於我們找到趨勢。q值越大，移動平均對短期的波動越不敏感。移動平均的基本目的就是從噪音中識別趨勢。快速的移動平均有偏小的q，它們更接近股票價格；而慢速的移動平均有較大的q值，這使得它們對波動不敏感從而更加穩定。

pandas提供了計算移動平均的函式。下面我將演示使用這個函式來計算蘋果公司股票價格的20天（一個月）移動平均值，並將它跟股票價格畫在一起。

Python

apple["20d"] = np.round(apple["Close"].rolling(window = 20, center = False).mean(), 2)
pandas_candlestick_ohlc(apple.loc['2016-01-04':'2016-08-07',:], otherseries = "20d")

12	apple["20d"]=np.round(apple["Close"].rolling(window=20,center=False).mean(),2)pandas_candlestick_ohlc(apple.loc['2016-01-04':'2016-08-07',:],otherseries="20d")

png

注意到平均值的起始點時間是很遲的。我們必須等到20天之後才能開始計算該值。這個問題對於更長時間段的移動平均來說是個更加嚴重的問題。因為我希望我可以計算200天的移動平均，我將擴充套件我們所得到的蘋果公司股票的資料，但我們主要還是隻關注2016。

Python

start = datetime.datetime(2010,1,1)
apple = web.DataReader("AAPL", "yahoo", start, end)
apple["20d"] = np.round(apple["Close"].rolling(window = 20, center = False).mean(), 2)
 
pandas_candlestick_ohlc(apple.loc['2016-01-04':'2016-08-07',:], otherseries = "20d")

12345

start=datetime.datetime(2010,1,1)apple=web.DataReader("AAPL","yahoo",start,end)apple["20d"]=np.round(apple["Close"].rolling(window=20,center=False).mean(),2)pandas_candlestick_ohlc(apple.loc['2016-01-04':'2016-08-07',:],otherseries="20d")

png

你會發現移動平均比真實的股票價格資料平滑很多。而且這個指數是非常難改變的：一支股票的價格需要變到平局值之上或之下才能改變移動平均線的方向。因此平均線的交叉點代表了潛在的趨勢變化，需要加以注意。

交易者往往對不同的移動平均感興趣，例如20天，50天和200天。要同時生成多條移動平均線也不難：

Python

apple["50d"] = np.round(apple["Close"].rolling(window = 50, center = False).mean(), 2)
apple["200d"] = np.round(apple["Close"].rolling(window = 200, center = False).mean(), 2)
 
pandas_candlestick_ohlc(apple.loc['2016-01-04':'2016-08-07',:], otherseries = ["20d", "50d", "200d"])

1234	apple["50d"]=np.round(apple["Close"].rolling(window=50,center=False).mean(),2)apple["200d"]=np.round(apple["Close"].rolling(window=200,center=False).mean(),2)pandas_candlestick_ohlc(apple.loc['2016-01-04':'2016-08-07',:],otherseries=["20d","50d","200d"])

png

20天的移動平均線對小的變化非常敏感，而200天的移動平均線波動最小。這裡的200天平均線顯示出來總體的熊市趨勢：股值總體來說一直在下降。20天移動平均線所代表的資訊是熊市牛市交替，接下來有可能是牛市。這些平均線的交叉點就是交易資訊點，它們代表股票價格的趨勢會有所改變因而你需要作出能盈利的相應決策。

請移動下節內容。你將讀到如何使用移動平局線來設計和測試交易策略。

更新：該文章早期版本提到演算法交易跟高頻交易是一個意思。但是網友評論指出這並不一定：演算法可以用來進行交易但不一定就是高頻。高頻交易是演算法交易中間很大的一部分，但是兩者不等價。

用Python做股市資料分析（一）

移動平均值

用Python做股市資料分析（一）

用 Python 做股市資料分析（2）

循序漸進：用python做金融量化分析（二）一條移動平均線策略系統建立

註冊會計師帶你用Python進行探索性風險分析（一）

【Python實戰】Pandas：讓你像寫SQL一樣做資料分析（一）

用實戰玩轉pandas資料分析（一）——使用者消費行為分析（python）

創業公司做資料分析（一）開篇

python的計數引用分析（一）

用WPF做報表控制元件（一）

用python來實現機器學習（一）：線性迴歸（linear regression）

資料分析（一）豆瓣華語電影分析

bigdata資料分析（一）：Java環境配置

企業如何運用好資料分析（一）

Spark快速大資料分析（一）

EXCEL資料分析（一）

房地產資料分析（一）

python/pandas/numpy資料分析（七）-MultiIndex

python變數與資料型別（一）

用Apache Spark進行大資料處理之用Spark GraphX圖資料分析（6）

【ML專案】基於網路爬蟲和資料探勘演算法的web招聘資料分析（一）——資料獲取與處理

用Python做股市資料分析（一）

移動平均值

相關推薦