資料分析時None和NaN區別

阿新 • • 發佈：2019-01-24

None vs NaN區別

在pandas中，如果其他的資料都是數值型別， pandas會把None自動替換成NaN, 甚至能將s[s.isnull()]= None,和s.replace(NaN, None)操作的效果無效化。這時需要用where函式才能進行替換。
None能夠直接被匯入資料庫作為空值處理，包含NaN的資料匯入時會報錯。
numpy和pandas的很多函式能處理NaN，但是如果遇到None就會報錯。
None和NaN都不能被pandas的groupby函式處理，包含None或者NaN的組都會被忽略。

等值性比較的總結:（True表示被判定為相等）

None對None	NaN對NaN	None對NaN
單值	True	False	False
tuple(整體)	True	True	False
np.array(逐個)	True	False	False
Series(逐個)	False	False	False
assert_equals	True	True	False
Series.equals	True	True	True
merge	True	True	True

由於等值性比較方面，None和NaN在各場景下表現不太一致，相對來說None表現的更穩定。

為了不給自己惹不必要的麻煩和額外的記憶負擔。實踐中，建議遵循以下三個原則即可

在用pandas和numpy處理資料階段將None,NaN統一處理成NaN,以便支援更多的函式。
如果要判斷Series,numpy.array整體的等值性，用專門的Series.equals,numpy.array函式去處理，不要自己用==

判斷 *
如果要將資料匯入資料庫，將NaN替換成None

資料分析時None和NaN區別

None vs NaN區別在pandas中，如果其他的資料都是數值型別， pandas會把None自動替換成NaN, 甚至能將s[s.isnull()]= None,和s.replace(NaN, None)操作的效果無效化。這時需要用where函式才能進行替換。None

EOS智慧合約開發（十八）從EOS資料分析history_plugin外掛和MongoDB外掛區別

EOS資料從EOS上線一段時間來看，他產生的Block已經遠遠超過了以太坊。以太坊在交易完成後，很容易過濾出交易資訊（如何獲取在我之前以太坊文章中有詳細描述）。EOS機制與以太坊有卻別，EOS如此大的資料量，我們就會問，EOS資料時如何獲取，查詢。今天我們就這個問題，給大家分析一下。

使用Scanner輸入字符串時next()和nextLine()區別

() 使用 next() lin tab style spa span 簡單在實現字符窗口的輸入時，很多人更喜歡選擇使用掃描器Scanner，它操作起來比較簡單。在編程的過程中，我發現用Scanner實現字符串的輸入有兩種方法，一種是next（），一種nextLine()

python資料分析基礎——numpy和matplotlib

numpy庫是python的一個著名的科學計算庫，本文是一個quickstart。引入：計算BMI BMI = 體重（kg）/身高（m）^2假如有如下幾組體重和身高資料，讓求每組資料的BMI值： weight = [65.4,59.2,63.6,88.4,68.7] heig

做資料分析，Python和R究竟哪個更強？

作者: Enoch Kan編譯: Mika本文為 CDA 資料分析師原創作品，轉載需授權幾十年來，研究人員和開發人員一直在爭論，進行資料科學和資料分析，Python和R語言哪種才是更好的選擇。近年來，資料科學在生物技術、金融和社交媒體等多個行業迅速發展。資料科學的重要性不僅

Queue介面分析：add和offer區別，remove和poll方法到底啥區別

往佇列中新增元素有兩個方法，分佈是add和offer方法，兩者的入參和返回值都一樣，或許很多同學都奇怪，為什麼，要有這兩個功能類似（都是新增元素），但方法名不一樣的方法，看看原始碼的註釋以下為Queue介面中方法定義： ``` public interface Queue<E

解讀｜資料分析的發展和演變經過哪幾個階段

作者: Deepesh Nair 編譯: Mika CDA 資料分析師原創作品，轉載需授權近年來，我們在資訊科技領域取得了巨大進步。在技術生態領域中取得的一系列革命性成果確實值得稱讚。在過去的十年到二十年裡，資料和分析一直是非常熱門的詞彙。因此我們需要明確它們是如何相互關聯的

【利用python進行資料分析】繪圖和視覺化

通常的引入約定是： import matplotlib.pyplot as plt fig,axes=plt.subplots(2,3) 這種用法，可以一下子產生2x3個子視窗，並且以numpy陣列的方式儲存在axes中，而fig仍然是整個影象物件，這樣我們可以通過對a

Nuxt.js asyncData方法獲取資料（await axios和 axios區別）

在專案中需要在初始化頁面前先得到資料，也就是我們常說的非同步請求資料。Nuxt.js貼心的為我們擴充套件了Vue.js的方法，增加了asyncData(){……}。從名字上就很好理解，這是一個非同步的方法。建立遠端資料在這裡製作一些假的遠端資料，我選擇的網站是myjson.com，它是一

Android筆記-service啟動過程分析：bindService原始碼分析、startService和bindService區別

前言： Service的啟動流程將會分為一個系列來講述。本系列開始將分析Service的啟動過程。看這個系列文章之前你所需要知道的知識點： 1. 熟悉service的基本用法。 2. 瞭解bind機制，知道android的客戶端和AMS間通

大資料分析平臺工程師和演算法工程師崗位職責：

參與大資料平臺的搭建和優化，包括Hadoop，spark，Kafka，ELK等軟體的配置和系統優化。計算學習基礎演算法，使用Java語言和python語言實現資料處理，熟悉spark和MapReduce。瞭解AMOS，DEA,Frontier,統計分析的基本步驟

利用python進行資料分析之繪圖和視覺化

matplotlib API入門使用matplotlib的辦法最常用的方式是pylab的ipython，pylab模式還會向ipython引入一大堆模組和函式提供一種更接近與matlab的介面，matplotlib API函式位於matplotlib.pyplot模組中，其通常的引入約定是：import

Java 集合之List 集合的新增方法順序分析以及add和addAll區別

本篇主要探討論證以下兩個問題：一、List集合有一個特點就是元素有序，即元素的存入順序與其取出順序一致。二、List集合的新增方法主要有add（）和addAll（）。那兩者的區別在哪呢 add（）是將傳入的的引數作為當前 List 中d的一個專案（Item）來儲存，即

使用hive 對lzo資料分析時的報錯

之前建立map作業將文字檔案通過combineInputFormat 合併小檔案並壓縮為lzo檔案，作業設定： conf.setInt("mapred.min.split.size", 1); conf.setLong("mapred

大型IT企業內部資料分析的現狀和發展趨勢

大資料時代，資料已經成為戰略資源。掌握前沿科技的大型IT企業在資料的分析和利用上走在了時代的前列。0.澄清基本概念I.大型IT企業：指對外提供IT相關的軟硬體產品及服務的公司，員工至少在萬人以上。II.資料平臺：指大型IT企業用來為自身服務為主，擔負資料儲存、處理、分析業務和

python資料分析五:Series和DataFrame的索引的方法(ix()方法)

# -*- coding: utf-8 -*- import pandas as pd from pandas import Series,DataFrame import numpy as np ''' 索引物件 ''' obj=Series(range(3),ind

Mybatis 中在傳參時，$ 和# 的區別

MyBatis中使用parameterType向SQL語句傳參，parameterType後的型別可以是基本型別int,String,HashMap和java自定義型別。在SQL中引用這些引數的時候，可以使用兩種方式#{parameterName}或者${parameterN

Java 集合之List 集合的刪除方法順序分析以及remove和removeAll區別

在上一篇《Java 集合之List 集合的新增方法順序分析以及add和addAll區別》中已經分析過對於List集合順序從前到後的分析論證，這裡將不再詳細分析 remove（）方法的順序此篇將就 remove（）和removeAll（）的區別分析 java的 Li

資料分析的方法論和方法

方法論指導方法，思考方法的方法 PEST,political、economic、social、technological 政治法律、經經濟、社會、技術 4P,product、price、place、promotion 立足市場分析，理解高價值使用者感知，

分析資料，持續預測和累計預測資料的區別

ECMWF data can be split into 3 main categories: analyses, instaneous forecasts and accumulated forecasts. Analyses are produced by combining short-

資料分析時None和NaN區別

None vs NaN區別

相關推薦