莫煩老師遺傳演算法程式碼筆記（+布林型索引）

阿新 • • 發佈：2018-11-27

在學習莫煩老師的遺傳演算法---找曲線最高點的例子的時候，讀程式碼的時候發現有個布林型索引。

參見：https://morvanzhou.github.io/tutorials/machine-learning/evolutionary-algorithm/2-01-genetic-algorithm/

全部程式碼註釋筆記如下：

"""
Visualize Genetic Algorithm to find a maximum point in a function.
視覺化遺傳演算法去找到一個函式的最高點
"""
import numpy as np
import matplotlib.pyplot as plt

DNA_SIZE = 10            # DNA length
POP_SIZE = 100           # population size，種群中個體數目
CROSS_RATE = 0.8         # mating probability (DNA crossover)，0.8的概率進行交叉配對
MUTATION_RATE = 0.003    # mutation probability，變異強度
N_GENERATIONS = 200      #迭代次數
X_BOUND = [0, 5]         # x upper and lower bounds，指定x的取值範圍


def F(x):
    return np.sin(10*x)*x + np.cos(2*x)*x     # to find the maximum of this function


# find non-zero fitness for selection
#我們都需要一個評估好壞的方程, 這個方程通常被稱為 fitness適應度.
#為了找到下面這個曲線當中的最高點. 那麼這個 fitness 方程可以定義為高度, 越高的點, fitness 越高.
def get_fitness(pred):
    return pred + 1e-3 - np.min(pred)#因為如果直接返回pred可能是負值，而我們在計算概率的時候不能為負值。
    #要進行處理，np.min表示取最小，為最大的負數，可以使全部只變成正的；1e-3為了讓float進行相除防止小數點後的數被省略


# convert binary DNA to decimal and normalize it to a range(0, 5)
#對基因的翻譯，如這裡函式，x軸是實數，這裡解釋瞭如何將遺傳0、1序列翻譯成實數。用十進位制二進位制轉換
#pop (population)是一個儲存二進位制 DNA 的矩陣, 他的 shape 是這樣 (pop_size, DNA_size)
#這裡DNA_SIZE，X_BOUND是超引數
def translateDNA(pop):
    return pop.dot(2 ** np.arange(DNA_SIZE)[::-1]) / float(2**DNA_SIZE-1) * X_BOUND[1]
    #dot()函式是矩陣乘,而*則表示逐個元素相乘
	#np.arange()函式返回一個有終點和起點的固定步長的排列
	#pop.dot(2 ** np.arange(DNA_SIZE)[::-1])已經轉換成十進位制
	#但是需要歸一化到0~5,如有1111這麼長的DNA,要產生的十進位制數範圍是[0, 15], 而所需範圍是 [-1, 1],就將[0,15]縮放到[-1,1]這個範圍
	#a[::-1]相當於 a[-1:-len(a)-1:-1]，也就是從最後一個元素到第一個元素複製一遍。所以你看到一個倒序
	#np.arange(DNA_SIZE)[::-1]得到10,9,8,...,0

#這裡進行優勝劣汰的選擇步驟
#適者生存的 select() 很簡單, 我們只要按照適應程度 fitness 來選 pop 中的 parent 就好. fitness 越大, 越有可能被選到.
def select(pop, fitness):    # nature selection wrt pop's fitness
    idx = np.random.choice(np.arange(POP_SIZE), size=POP_SIZE, replace=True,p=fitness/fitness.sum())
	#這裡概率不能為負，所以pred要進行非負處理
	#replace表示抽樣後是否放回，這裡為True表示有放回，則可能會出現相同的索引值
    # p 就是選它的比例，按比例來選擇適應度高的,也會保留一些適應度低的，因為也可能後面產生更好的變異
    #np.random.choice表示從序列中取值  np.arange()函式返回一個有終點和起點的固定步長的排列
    return pop[idx]

#繁衍，交叉父母的基因
def crossover(parent, pop):     # mating process (genes crossover)
    if np.random.rand() < CROSS_RATE: #這裡是0.8的概率父親會選擇一個母親進行交叉配對
        i_ = np.random.randint(0, POP_SIZE, size=1)                           #select another individual from pop選擇母親索引一個
        cross_points = np.random.randint(0, 2, size=DNA_SIZE).astype(np.bool) #得到一行[01001100]也是0、1為了選擇哪些點進行交叉;然後進行布林化
        parent[cross_points] = pop[i_, cross_points]
		#布林型陣列可以用於陣列索引，布林型陣列長度必須跟被索引的軸長度一致
		#生成布林陣列可以組合應用多個布林條件,使用&(和),|(或)之類的布林算數運算子，python的關鍵字and和or在布林型陣列中無效
		#parent[cross_points]即parent列表中取出cross_points為True地方的值&&&&&！！！！
		#【母親是pop的i_索引行DNA，選出母親對應在cross_points為TRUE的地方的值】賦給【父親DNA對應在cross_points選出為TRUE的地方的值】。
    return parent

#繁衍，有變異的基因會出現
#將某些 DNA 中的 0 變成 1, 1 變成 0
def mutate(child):
    for point in range(DNA_SIZE):
        if np.random.rand() < MUTATION_RATE:
            child[point] = 1 if child[point] == 0 else 0
    return child

#產生離散均勻分佈的整數，若high不為None時，取[low,high)之間隨機整數，否則取值[0,low)之間隨機整數。
pop = np.random.randint(2, size=(POP_SIZE, DNA_SIZE))   # initialize the pop DNA
#pop = np.=random.randint(0,2,(1,DNA_SIZE).repeat(POP_SIZE,axis=0))這裡是生成了一樣的DNA，後面也可以隨著變異變成不一樣的

#[[01001100],
# [10111100],
# ...]
plt.ion()       # something about plotting開啟影象互動模式

x = np.linspace(*X_BOUND, 200)
#linspace(start, stop, num=50, endpoint=True, retstep=False, dtype=None)
#X_BOUND = [0, 5],要產生200個樣本點
#返回固定間隔的資料。他將返回num個等間距的樣本，在區間[start,stop]中。其中，區間的結束端點可以被排除在外(用endpoint標識)
plt.plot(x, F(x))

for _ in range(N_GENERATIONS):
    F_values = F(translateDNA(pop))    # compute function value by extracting DNA傳入到F函式

    # something about plotting
    if 'sca' in globals(): sca.remove()
    sca = plt.scatter(translateDNA(pop), F_values, s=200, lw=0, c='red', alpha=0.5); plt.pause(0.05)#plt.pause表示顯示秒數

    # GA part (evolution)
    fitness = get_fitness(F_values) #計算適應度
    print("Most fitted DNA: ", pop[np.argmax(fitness), :])
    pop = select(pop, fitness)#這裡選出了另外一種population
    pop_copy = pop.copy()# 備個份
    for parent in pop: #這裡parent為遍歷pop，一次為其中一行，而這裡的pop是從原pop中按適應度概率有放回的選出了POP_SIZE行
        child = crossover(parent, pop_copy)#繁衍
        child = mutate(child) #進行變異
        parent[:] = child       # parent is replaced by its child# 寶寶變大人

plt.ioff(); plt.show()

#在使用matplotlib的過程中，不能像matlab一樣同時開幾個視窗進行比較，可以採用互動模式，但是放在腳本里執行一閃而過，影象並不停留
#python視覺化庫matplotlib有兩種顯示模式：阻塞（block）模式&互動（interactive）模式
#在互動模式下：plt.plot(x)或plt.imshow(x)是直接出影象，不需要plt.show()
#如果在指令碼中使用ion()命令開啟了互動模式，沒有使用ioff()關閉的話，則影象不會常留。防止這種情況，需要在plt.show()之前加上ioff()命令。
#在阻塞模式下：開啟一個視窗以後必須關掉才能開啟下一個新的視窗。這種情況下，預設是不能像Matlab一樣同時開很多視窗進行對比的
#plt.plot(x)或plt.imshow(x)是直接出影象，需要plt.show()後才能顯示影象

這裡布林型索引在crossover函式中出現：

def crossover(parent, pop):     # mating process (genes crossover)
    if np.random.rand() < CROSS_RATE: #這裡是0.8的概率父親會選擇一個母親進行交叉配對
        i_ = np.random.randint(0, POP_SIZE, size=1)                           #select another individual from pop選擇母親索引一個
        cross_points = np.random.randint(0, 2, size=DNA_SIZE).astype(np.bool) #得到一行[01001100]也是0、1為了選擇哪些點進行交叉;然後進行布林化
        parent[cross_points] = pop[i_, cross_points]
		#布林型陣列可以用於陣列索引，布林型陣列長度必須跟被索引的軸長度一致
		#生成布林陣列可以組合應用多個布林條件,使用&(和),|(或)之類的布林算數運算子，python的關鍵字and和or在布林型陣列中無效
		#parent[cross_points]即parent列表中取出cross_points為True地方的值&&&&&！！！！
		#【母親是pop的i_索引行DNA，選出母親對應在cross_points為TRUE的地方的值】賦給【父親DNA對應在cross_points選出為TRUE的地方的值】。
    return parent

這裡函式輸入parent是主迴圈中遍歷pop的每一行得到的array，是一個個體的基因，即一行；輸入的pop是全部個體的DNA,ndarry型別（從原pop中按適應度概率有放回的選出了POP_SIZE行）。

當隨機值小於超引數cross_rate時就要進行交叉配對，i_是從全部個體中選出的索引值，如4，cross_points是隨機生成一個DNA長度的二進位制序列，再轉化為布林值。

parent[cross_points]：parent（可看成父親的DNA）列表中取出cross_points為True索引處的值

pop[i_, cross_points]：pop第i_行（可看為母親的DNA）列表中取出cross_points為True索引處的值，

【母親是pop的i_索引行DNA，選出母親對應在cross_points為TRUE的地方的值】賦給【父親DNA對應在cross_points選出為TRUE的地方的值】

這裡我理解應該是布林型索引記住了值和索引

然後這裡我舉了一個有5個樣本，8長度的DNA例子

參看布林型索引另一例子：https://blog.csdn.net/xsl15181685808/article/details/79734872

莫煩老師遺傳演算法程式碼筆記（+布林型索引）

在學習莫煩老師的遺傳演算法---找曲線最高點的例子的時候，讀程式碼的時候發現有個布林型索引。參見：https://morvanzhou.github.io/tutorials/machine-learning/evolutionary-algorithm/2-01-genetic-algori

小白的資料結構與演算法學習筆記（二十六）----廣義表

一、廣義表的概述首先回憶一下原子型別和結構型別，簡單說來，原子型別就是不可再分的型別，結構型別就是可以再分的型別。我們前面講的線性表要求每個元素都是原子型別，而廣義表作為線性表的推廣，它的元素可以是原子型別，也可以是個表。元素是原子型別，叫原子結點；元素是表，叫表結點。

大三筆記（泛型小記）

泛型方法泛型類，是在例項化類的時候指明泛型的具體型別；泛型方法，是在呼叫方法的時候指明泛型的具體型別。 /** * 泛型方法的基本介紹 * @param tClass 傳入的泛型實參 * @retur

C語言中實現bool（布林型變數）

C語言中，本身沒有bool（布林型變數）。但是我們可以用其他方式來模擬。一、如果簡單的使用char、int、long變數來表示0/1，則太浪費空間了。二、這裡介紹一種巧妙的方式實現bool，高空間利用率。#define true 1 #define false 0 //--

[work] 演算法學習筆記（爬山法，模擬退火演算法，遺傳演算法）

在優化問題中，有兩個關鍵點代價函式確定問題的形式和規模之後，根據不同的問題，選擇要優化的目標。如本文涉及的兩個問題中，一個優化目標是使得航班選擇最優，共計12個航班，要使得總的票價最少且每個人的等待時間之和最小。第二個問題是學生選擇宿舍的問題，每個學生可以實現填報

Python程式碼筆記（1）輾轉相除法/歐幾里得演算法求最大公約數gcd（m,n）

歐幾里得演算法求最大公約數：輾轉相除法具體做法：用較小數除較大數，再用出現的餘數（第一餘數）去除除數，再用出現的餘數（第二餘數）去除除數，如此反覆，直到最後餘數是0為止。如果是求兩個數的最大公約數，

資料結構與演算法JavaScript描述讀書筆記（js實現樹）

js定義二叉查詢樹 //建立建構函式建立節點 function Node(data){ this.data = data; this.left = null; this.right = null; } function tree(){ this.root = nu

演算法導論第二章：演算法入門筆記（插入排序、迴圈不變式、演算法分析、最好和最壞時間複雜度、選擇排序、分治法、合併排序）

插入排序：排序問題的定義如下：輸入：N個數{a1, a2,..., an }。輸出：輸入序列的一個排列{a'1 ,a'1 ,...,a'n }，使得a'n <=a' n<=...<

C++ 泛型演算法學習筆記（equal, accumulate, back_iterator, pair）

equal equal是區間比較演算法原型為： template <class _InputIterator1, class _InputIterator2> inline _LIBCPP_INLINE_VISIBILITY bool equal(_InputIt

演算法學習筆記（一）

演算法筆記（一）一什麼是正確的回答一個演算法問題回答一個演算法問題，並不是一下子回答出來一個解決方案，而應該是和麵試官探討的過程，在探討過程中逐漸選擇一個最優方案對一組資料進行排序這組資料有什麼樣的特徵？有沒有包含大量重複的元素？

Effective_STL 學習筆記（四十七）避免產生只寫程式碼

假設有一個 vector<int>，想要去掉 vector 中的值小於 x 而出現在至少和 y 一樣大的最後一個元素之後的所有元素 1 　　vector<int> v; 2 　　int x, y; 3 　　. . . 4 　　v.erase( remove_if

字串筆試題-演算法筆試筆記（一）

1.前言做了好幾家公司的筆試程式設計題，其中涉及到了很多字串的題，有做出來的也有沒做出來後來上網學習大佬的程式碼的（有的還涉及到了最優解），於是在這裡記錄一下，加深自己的印象，題目是憑藉的回憶，解決方法多數是參考的網路上其他的大佬。 2.字串筆試題騰訊筆試程式設計題

《第一行程式碼》第五章：全域性大喇叭筆記（基於Android8.0）

由於Android8.0對廣播機制做了很大的調整理，導致《第一行程式碼》中很多例項無法正常執行，因此我結合書本，自行整理了一下。廣播需要接收器和傳送器。系統的動作都會發送一條廣播，例如電量的變化，系

KCF跟蹤演算法學習筆記（1）

KCF跟蹤是相關濾波跟蹤器最具有代表性的，但是作為一個從來沒接觸過跟蹤演算法，線代苦手來說，看懂KCF中的原理簡直是難上加難，網上所有的相關文件要說也夠多了，可惜水平太差，看完以後只想問兩個問題，這是什麼？這又是什麼？再難啃的骨頭也是要啃的，所以決定把目前還一知半解的學習內容

2.遺傳演算法matlab實現（2）：再加例項兩個（一元二元完整作圖，二維圖形,三維圖形以及進化過程圖）

（1）直接在命令視窗輸入以下程式碼: figure(1); hold on; lb=1;ub=2; %函式自變數範圍[1,2] ezplot('sin(10*pi*X)/X',[lb,ub]);

圖解演算法學習筆記（一）: 演算法簡介

本章內容：編寫第一種查詢演算法——二分查詢。學習如何談論演算法的執行時間——大O表示法。 1) 演算法是一組完成任務的指令，任何程式碼片段都可視為演算法。 2)二分查詢：一種查詢演算法，其輸入是一個有序的元素列表。 Python實現二分查詢程式碼：

莫煩大大keras學習Mnist識別（3）-----CNN

一、步驟：匯入模組以及讀取資料資料預處理構建模型編譯模型訓練模型測試二、程式碼：匯入模組以及讀取資料 #導包 import numpy as np np.random.seed(1337) # from k

莫煩大大keras學習Mnist識別（4）-----RNN

一、步驟：匯入包以及讀取資料設定引數資料預處理構建模型編譯模型訓練以及測試模型二、程式碼： 1、匯入包以及讀取資料 #匯入包 import numpy as np np.random.seed(1337) #設定之後每次執

圖解演算法學習筆記（四）：快速排序

本章內容：學習分而治之，快速排序 1）示例1：假設你是農場主，有一小塊土地，你要將這塊地均勻分成方塊，且分出的方塊儘可能大。如何分？你要將這塊地均勻分成方塊，且分出的方塊要儘可能大。顯然，下面的分法不符合要求。此時，你應該使用D&C策略（div

圖解演算法學習筆記（六）：廣度優先搜尋

本章內容; 學習使用新的資料結構圖來建立網路模型；學習廣度優先搜尋；學習有向圖和無向圖；學習拓撲排序，這種排序演算法指出了節點之間的依賴關係。 1）圖簡介假設你住在舊金山，要從雙子峰前往金門大橋。你想乘

莫煩老師遺傳演算法程式碼筆記（+布林型索引）

相關推薦