【轉載】EXCEL VBA 通過VBA中的Union合併多個Range選擇區域

阿新 • • 發佈：2021-11-13

什麼是決策樹？

關鍵字：熵、Gini係數CART、資訊增益ID3、資訊增益率C4.5、決策樹剪枝、隨機森林

決策樹(decision tree)是一種基本的分類與迴歸方法

根節點 age<15,非葉子節點 is male,葉子節點娃娃頭（結果值），分支（Y ，N）

如何利用資料構造一個決策樹？各個節點應該用哪一個特徵和怎樣排列？

根據熵的大小（混亂程度：越大越混亂）

熵定義為資訊的期望值。在資訊理論與概率統計中，熵是表示隨機變數不確定性的度量。如果待分類的事務可能劃分在多個分類之中，則符號xi的資訊定義為

p(xi):xi 發生的概率(0,1),p(xi)越小，發生的概率小，熵越大，反之熵越小。

根據Gini係數（原理跟熵一樣，Pk 發生的概率）

得到高度最矮的決策樹

資訊增益（越大越好）

類似table 2的一張表裡面，篩選出outlook=sunny的全部詞條，分別再次計算（類似遞迴）

資訊增益缺點：資料的有些特徵對最終結果並沒有直接影響，但是資訊增益在計算的時候缺將其包含在內，這就引起了最終資料的偏差（比如序號1-N）

對應資訊增益缺點:資訊增益率=資訊增益/自身熵值

如何判斷這個決策樹的好壞：評價函式

t是每一個葉子節點，H（t）熵值，Nt 當前葉子節點的權重值（葉子節點裡麵包含多少個類別）【評價函式越小越好】

連續值：比如說age<=30, 劃分離散值 5-10,11-15,16-20,21-25,26-30 等等分支

決策樹剪枝：

不剪枝的話可能會出現過擬合，在訓練集上可能達到100%的效果，樹比較高，分支多（考慮每一個樣本），在預測樣本上效果就不是很好。

預剪枝：在構建決策樹的時候，計劃提前停止，比如深度D，定義D>4 的時候就結束構造決策樹；或者一個節點當前樣本數量min_samples<30就停止這個節點往下的分裂延伸

後剪枝：決策樹構建後，再進行裁剪（用到下面的公式）

α是權重(越大的話修剪越多，葉子節點數越少) C（T）是上面提到過的評價函式 T_leaf(葉子節點個數)

隨機森林

有放回取樣：資料【1,2,3,4】 -> 取樣1 1 3 3 4 2 3 4 。

行成不同的N棵樹，分別投喂同樣的test資料，將結果取眾數輸出

隨機：

1.資料選擇隨機：有放回取樣，指定隨機的取樣比例，只選擇所有樣本中的一部分（機率過濾噪點）

2.關於特徵隨機：可能有些特徵表達效果很差，通過隨機有的能過濾掉這些差特徵，選擇一定比例的特徵（無放回）

【轉載】EXCEL VBA 通過VBA中的Union合併多個Range選擇區域

在Excel中，Union的功能是合併兩個或兩個以上的選擇區域，合併成為一個更大的區域。所合併的多個選擇區域，這些選擇區域，可以是不連續的，也可以是連續的。一般情況下，要使用Union，可通過如下來使用。expressio

【轉載】EXCEL VBA 中的Range.offset和Range.resize

在Excel VBA中range.offset和range.resize均可以重新選擇區域，但range.offset表示偏移且偏移後尺寸不改變，range.resize則會根據輸入的行數和列數重新定義區域。

【轉載】EXCEL VBA-區域選擇

1- 區域命名 ThisWorkbook.Names.Item(\"foo\").RefersTo =Tabelle1!$A$1:$B$1 ThisWorkbook.Names.Item(\"foo\").RefersToRange.Address

【轉載】EXCEL VBA 關於範圍選擇程式碼集

Range(“A1:B2”).Select ‘選中“A1”、“A2”、“B1”、“B2”四個連續的單元格 Range(“12:12”).Select ‘選中第12行 Range(“B:B”).Select ‘選中B列 Range(“A1:A2,B7,2:2”).Select

【轉載】EXCEL VBA 工作表拆分

用VBA拆分工作表是一個不錯的方法，特別是在處理大量資料的時候，能節省不少時間。

【轉載】EXCEL VBA 自動篩選—AutoFilter方法

AutoFilter方法的語法及說明下面是Range物件的AutoFilter方法的語法： Range物件.AutoFilter(Field,Criterial1,Operator,Criteria2,VisibleDropDown)

【轉載】EXCEL VBA Workbook、Worksheet、Range的選擇和操作

Workbooks物件是Microsoft Excel 應用程式中當前開啟的所有 Workbook 物件的集合。有close、add、open等方法。

【轉載】EXCEL VBA 同時選擇多個工作表的方法

如果要用VBA同時選擇多個工作表，可以利用陣列或設定“Select”方法的引數為“False”來擴充套件所選擇的內容，如下面的一些程式碼：

【轉載】EXCEL VBA 工作簿（表）合併拆分

一、合併工作簿 Sub 合併工作簿() Application.ScreenUpdating = False myfile = Dir(ThisWorkbook.Path & \"\\*.xls*\")\'Dir函式，獲取同路徑下待合併excel的檔名

【轉載】EXCEL VBA 自定義排序的三種方法

何謂自定義排序，就是按指定的順序對資料來源進行排序唄。共分享了三種方法：

【轉載】EXCEL VBA UBound(arr,1),UBound(arr,2)解釋

Resize(UBound(arr, 1), UBound(arr, 2) 這句什麼意思 resize（）是一個擴充套件單元格地址區域的函式，有兩個引數，第一個是行擴充套件數，第二個是列擴充套件數

【轉載】EXCEL VBA 20個有用的ExcelVBA程式碼

1.顯示多個隱藏的工作表如果你的工作簿裡面有多個隱藏的工作表，你需要花很多時間一個一個的顯示隱藏的工作表。

【轉載】EXCEL VBA 選取非連續的單元格區域——Areas集合

出處：http://www.360doc.com/content/21/1113/17/77710807_1004011085.shtml 前面我們講的大多是**並操作單個的單元格，或者是連續的單元格區域，如果這些單元格區域不連續，如下圖所示，單元格區域A1:B2、A4:B5、

【轉載】python自動提取文字中的時間（包含中文日期）

原文出處：https://www.cnblogs.com/i-love-python/p/12763063.html 有時在處理不規則資料時需要提取文字包含的時間日期。dateutil.parser模組可以統一日期字串格式。datefinder模組可以在字串中提取日期。datefinde

【轉載】Django form在模版中的渲染方式

原文連結：https://www.cnblogs.com/solozorro/p/6165214.html form在模版中的渲染方式一、form.as_p

【轉載】SQL SERVER 儲存過程中執行動態Sql語句

　　MSSQL為我們提供了兩種動態執行SQL語句的命令，分別是EXEC和sp_executesql;通常,sp_executesql則更具有優勢，它提供了輸入輸出介面，而EXEC沒有。還有一個最大的好處就是利用sp_executesql，能夠重用執行計劃，

【轉載】外網通過kubeconfig訪問內網下k8s叢集

公有云上組建k8s叢集時，通常是使用繫結在節點網絡卡上的IP地址來部署叢集，此時，一般使用的是192.168.x.x這樣的私網IP。

【轉】在linux下使用gcc/g++編譯多個.h檔案

轉自：https://www.jianshu.com/p/e5c6a255076b 博主寫得很好多個檔案編譯在linux下編譯，下面有三個檔案，分別是1.cpp 和 2.cpp 和myhead.h 檔案。

【解決】簡單有效的解決百度地圖多個標記點多個資訊視窗只顯示一個問題(vue-baidu-map)

技術標籤：vscodevue.js 【解決】簡單有效的解決百度地圖多個標記點多個資訊視窗只顯示一個問題(vue-baidu-map)

【轉載】9種HTML中通過CSS方式隱藏元素的方法

1、通過style屬性中的 display : none 2 、通過style屬性中的 visibility : hidden 這兩種方式的區別是:display 設定為 none之後, 該元素不佔用文件流;visibility 設定為 hidden之後, 該元素仍然佔用文件流, 只

【轉載】EXCEL VBA 通過VBA中的Union合併多個Range選擇區域

相關推薦