1. 程式人生 > >EXCEL 資料分析基礎知識

EXCEL 資料分析基礎知識

1、編碼

1 byte可以存256個字元,最初的儲存方式ASCII,就存了英文+數字+符號

漢字遠遠大於256種可能,與使用2byte組合表示,叫做GB2312,後來為了表示更多的漢字,用了GBK,它是拓展版,連繁體字都包括了,

可是中國還有少數民族啊,少數民族的文字怎麼辦,於是有了GB18030,

可是全世界有多少國家多少少數民族?,於是發明了萬國碼,叫做unicode

UTF-8是一種整合版編碼,編碼英文的時候和ASCII一樣採用8個位元組,但是編碼中文的時候卻要32位,所以有時候為了節省儲存空間,更喜歡用12位的GB系列編碼方式編碼含有中文的資料。

2、常見文字清洗函式

FINd : 找到要查詢物件第一次出現的位置, find("要找的物件",要找的區域)

LEFT : 從左邊第一個位置開始擷取, left(要擷取的物件,擷取結束位置)

RIGHT : 從右邊第一個位置開始擷取, right(要擷取的物件,擷取結束位置)

CONCATENATE : &只可以單個字元拼接,concatenate可將最多 255 個文字字串合併為一個文字字串。聯接項可以是文字、數字、單元格引用或這些項的組合。CONCATENATE(text1, [text2], ...)

REPLACE : REPLACE函式的作用是根據指定的字元數,將部分文字字串替換為不同的文字字串。

REPLACE(old_text, start_num, num_chars, new_text)

TRIM : 刪除物件前後的空格

SUBSTITUTE : 在某一文字字串中替換指定的文字。SUBSTITUTE(text,old_text,new_text,[instance_num]),

Text 為需要替換其中字元的文字,或對含有文字的單元格的引用。Old_text 為需要替換的舊文字。New_text 用於替換 old_text 的文字。Instance_num 為一數值,用來指定以 new_text 替換第幾次出現的 old_text。如果指定了 instance_num,則只有滿足要求的 old_text 被替換;如果預設則將用 new_text 替換 TEXT 中出現的所有 old_text。

len : 提取物件的長度

mid : 從中間提取。MID(text, start_num, num_chars)

3、關聯匹配函式

VLOOKUP : 表關聯查詢


VLOOKUP(lookup_value,table_array,col_index_num,range_lookup)

引數
簡單說明
輸入資料型別
lookup_value
要查詢的值
數值、引用或文字字串
table_array
要查詢的區域
資料表區域
col_index_num
返回資料在查詢區域的第幾列數
正整數
range_lookup
模糊匹配/精確匹配
TRUE(或不填)/FALSE

index : 返回表或區域中的值或對值的引用,返回的是單元格的值


輸入公式=INDEX(B3:D6,4,3)
資料表區域(B3:D6),行數(4),列數(3)
MATCH 函式是EXCEL主要的查詢函式之一,該函式通常有以下幾方面用途:(1)確定列表中某個值的位置;(2)對某個輸入值進行檢驗,確定這個值是否存在某個列表中;(3)判斷某列表中是否存在重複資料;(4)定位某一列表中最後一個非空單元格的位置。查詢文字值時,函式 MATCH 不區分大小寫字母。
MATCH函式含義:返回指定數值在指定陣列區域中的位置
語法:MATCH(lookup_value, lookup_array, match_type)

row : 返回所在行

COLUMN : 返回所在列

Offset : 是Excel中的函式,在Excel中,OFFSET函式的功能為以指定的引用為參照系,通過給定偏移量得到新的引用。返回的引用可以為一個單元格或單元格區域。並可以指定返回的行數或列數。Reference 作為偏移量參照系的引用區域。Reference 必須為對單元格或相連單元格區域的引用;否則,函式 OFFSET 返回錯誤值#VALUE!。
函式語法
OFFSET(reference,rows,cols,height,width)
HYPERLINK : 轉換為超連結

4、邏輯運算函式 : TRUE(1)   FALSE(0)  AND OR  IF  IS系列
5、邏輯運算函式:
SUM : 求和           SUMPRODUCT : 兩列乘積累加           COUNT :統計個數         MAX/MIN :最大最小值

RANK : 查排名     RANDBETWEEN :生成隨機數字,RANDBETWEEN(1,10)       AVERAGE :平均數

QUARTILE : 求分位數      STDEV : 求標準差  

SUBTOTAL : 

語法: SUBTOTAL(function_num,ref1,ref2, ...)
Function_num 為 1 到 11(包含隱藏值)或 101 到 111(忽略隱藏值)之間的數字,指定使用何種函式在列表中進行分類彙總計算。
Function_num (包含隱藏值)
為1到11之間的自然數,用來指定分類彙總計算使用的函式
1 、1 AVERAGE(算術平均值)
2、 2 COUNT(數值個數)
3、 3 COUNTA(非空單元格數量)
4 、4 MAX(最大值)
5 、5 MIN(最小值)
6 、6 PRODUCT(括號內所有資料的乘積)
7 、7 STDEV(估算樣本的標準偏差)
8 、8 STDEVP(返回整個樣本總體的標準偏差)
9、 9 SUM(求和)
10 、10 VAR(計算基於給定樣本的方差)
11 、11 VARP(計算基於整個樣本總體的方差)


INT : 向下取整,int(1.2345) = 1               

 ROUND:四捨五入取整, round(取整物件,小數位數) round(1.5342,2) = 1.53,若小數位數為負值,則會向百分位上擴充套件,如:round(976.396,-1) = 980

COUNTIF :按條件統計 countif(統計區域,條件)   countif(Q:Q,>10)

COUNTIFS :按多條件統計 countif(統計區域,條件,統計區域,條件)   countif(Q:Q,>10,R:R,<20)

SUMIF :按條件求和, sumif(條件區域,條件,求和區域)

AVERAGEIF : 按條件求平均數 

ABS : 絕對值

6、時間序列函式

YEAR : 返回年   MONTH : 返回月   DAY: 返回日

WEEKDAY : weekday(區域,格式) 返回代表一星期中某天的整數。   格式為1表示星期日為第一天,2表示星期一為第一天

WEEKNUM : 返回本週是一年中的第幾周

NOW :返回當前時間,精確到秒              TODAY:返回當前時間,精確到天

DATE : 日期拼接  date(年,月,日)

7、快捷鍵

Ctrl + 方向鍵 游標快速移動

Ctrl + Shift +方向鍵,快速框選

Ctrl + 空格鍵,選定整列

Shift + 空格鍵,選定整行

Ctrl + A,選定整張表

Alt + Enter 換行
--------------------- 
作者:penguinlovepanda 
來源:CSDN 
原文:https://blog.csdn.net/penguinlovepanda/article/details/79597829 
版權宣告:本文為博主原創文章,轉載請附上博文連結!