資料清洗(三)------檢查資料邏輯錯誤
阿新 • • 發佈:2019-01-08
檢查資料邏輯錯誤
資料邏輯錯誤通常分兩種:(1)被調查者輸入的選項不符合要求。eg:最多3個選項的多選題,答題者選了4個選項。
(2)錄入錯誤。eg:二分法的多選題錄入時,出現了0和1以外的資料。
檢查方法:if函式和or函式
IF(logical_test,value_if_true,value_if_false)
OR(logical1,logical2,logical3,.......)----至少一個引數為真,就返回true
AND(logical1,logical2,logical3,.......)--所有引數都為真時,才返回true
(一)用IF函式檢查第一類錯誤
有4道題,每道題有ABCDEFG個選項,每個選項被選中則為1,否則為0,既不為0又不為1的屬於錄入錯誤。
如上圖所示,在 I21單元格內輸入=IF(COUNTIF(B21:H21,"<>0")>3,"錯誤","正確")等式,在檢驗列的剩下單元格也輸入相應的等式。由結果可知,被調查者在答第2道題的時候輸入的選項不符合要求。
(二)用條件格式和OR函式標記錄入錯誤
開始---條件格式---突出顯示單元格規則---其他規則---使用公式確定要設定格式的單元格---在“為符合此公式的值設定格式”文字框中輸入“=OR(B21=1,B21=0)=FALSE”
由上圖所示,錄入錯誤即被標記出來。