資料比賽專案資料視覺化模組程式碼大全

阿新 • • 發佈：2020-08-08

import numpy as np #匯入資料結構nmupy模組
import matplotlib.pyplot as plt #匯入matplotlib影象輸出模組
plt.rcParams["font.sans-serif"]=["SimHei"] #輸出影象的標題可以為中文正常輸出
plt.rcParams["axes.unicode_minus"]=False #可以正常輸出圖線裡的負號
import pandas as pd
from pandas.plotting import scatter_matrix
import seaborn as sns
#1-1連續變數之間散點圖輸出
data=pd.read_excel("資料清洗完的最終有效資料1.xlsx")
 
x=data["點贊數"]
y=data["評論數"]
#data=data[["點贊數","評論數","得分1","得分2","得分3","得分4"]]
#data=data[["點贊數","評論數"]]

#離散特徵與連續變數之間的箱式圖分佈
plt.figure()
x1=["點贊數","評論數"]
for i in range(len(x1)):
    plt.subplot(2,1,i+1)
    sns.boxplot(data[x1[i]],data["年級"],orient="h")
    #plt.title("話題與{}箱式圖分佈".format(x1[i]))
plt.show()

'''

corr=data.corr()
 
corr=abs(corr)
ax=sns.heatmap(corr,vmax=1,vmin=0,annot=True,annot_kws={"size":13,"weight":"bold"},linewidth=0.05)
#plt.xticks(fontsize=15)
#plt.yticks(fontsize=15)
plt.xlabel("資料名稱")
plt.ylabel("資料名稱")
plt.title("點贊數與評論數的相關係數圖")
plt.show()

#離散特徵與連續變數之間的箱式圖分佈
plt.figure()
x1=["得分1","得分2","得分3","得分4"]
for i in range(len(x1)):
 
    plt.subplot(2,2,i+1)
    sns.boxplot(data[x1[i]],data["年級"],orient="h",color="black")
    #plt.title("話題與{}箱式圖分佈".format(x1[i]))
plt.show()

plt.subplot(2,2,2)
plt.scatter(data["評論數"],data["得分2"]) #畫散點圖的函式scatter（其中XY表示數值的大小，s表示散點的尺寸大小，c表示顏色，alpha表示透明度)
plt.xlabel("評論數")
plt.ylabel("得分2")

plt.subplot(2,2,3)
plt.scatter(data["評論數"],data["得分3"]) #畫散點圖的函式scatter（其中XY表示數值的大小，s表示散點的尺寸大小，c表示顏色，alpha表示透明度)
plt.xlabel("評論數")
plt.ylabel("得分3")

plt.subplot(2,2,4)
plt.scatter(data["評論數"],data["得分4"]) #畫散點圖的函式scatter（其中XY表示數值的大小，s表示散點的尺寸大小，c表示顏色，alpha表示透明度)
plt.xlabel("評論數")
plt.ylabel("得分4")
#plt.title("評論數與各個目標得分之間的分佈散點圖")
plt.show()

corr=data.corr()
corr=abs(corr)
ax=sns.heatmap(corr,vmax=1,vmin=0,annot=True,annot_kws={"size":13,"weight":"bold"},linewidth=0.05)
#plt.xticks(fontsize=15)
#plt.yticks(fontsize=15)
plt.xlabel("資料名稱")
plt.ylabel("資料名稱")
plt.title("點贊數評論數與四大目標評分的相關係數圖")
plt.show()
corr=data.corr()
corr=abs(corr)
ax=sns.heatmap(corr,vmax=1,vmin=0,annot=True,annot_kws={"size":13,"weight":"bold"},linewidth=0.05)
#plt.xticks(fontsize=15)
#plt.yticks(fontsize=15)
plt.xlabel("資料名稱")
plt.ylabel("資料名稱")
plt.title("點贊數評論數與四大目標評分的相關係數圖")
plt.show()

scatter_matrix(data)
#plt.title("各資料之間散佈矩陣")
plt.show()

#plt.axes([0.025,0.025,0.95,0.95]) #指定顯示範圍
plt.scatter(x,y) #畫散點圖的函式scatter（其中XY表示數值的大小，s表示散點的尺寸大小，c表示顏色，alpha表示透明度)
#plt.xlim(-1.5,1.5),plt.xticks([]) #x和y座標軸的範圍
#plt.ylim(-1.5,1.5),plt.yticks([]) #x和y座標軸的範圍
plt.axis() #顯示所有影象範圍
plt.title("點贊數與評論數散點圖輸出")
plt.xlabel("點贊數")
plt.ylabel("評論數")
plt.show()

fig,ax=plt.subplots(figsize=(12,10))
sns.regplot("點贊數","評論數",data=data,ax=ax)
ax.set_xlabel("點贊數")
ax.set_ylabel("評論數")
fig.tight_layout()

#不同連續變數之間的視覺化展示
cov = np.corrcoef(data.T)
img = plt.matshow(cov,cmap=plt.cm.winter)
plt.colorbar(img, ticks=[-1,0,1])
plt.xticks(np.arange(len(data.keys())), data.keys())
plt.yticks(np.arange(len(data.keys())), data.keys())
#plt.title("各資料之間相關係數分佈圖")
plt.show()


#第一種箱式圖
data[["點贊數","話題"]].boxplot(by="話題")
plt.xlabel("話題種類")
plt.ylabel("點贊數大小")
#plt.title("話題-點贊數箱式圖")
plt.show()

#第二種seaborn繪製箱線圖
import warnings
warnings.filterwarnings("ignore")#不顯示warning
#plt.style.use("ggplot")#美化圖片
#plt.figure(figsize=(15,8))
for i in ["話題","省","學段","年級"]:
    sns.boxplot(data["點贊數"],data[i],orient="h")
    plt.title("{}與點贊數箱式圖分佈".format(i))
    plt.show()

    sns.boxplot(data["評論數"],data[i],orient="h")
    plt.title("{}與評論數箱式圖分佈".format(i))
    plt.show()
'''


#value_counts的函式輸出展示
import matplotlib.pyplot as plt
import matplotlib
matplotlib.rcParams['font.sans-serif'] = ['SimHei']
matplotlib.rcParams['axes.unicode_minus'] = False
price =data["年級"].value_counts().values
x=len(data["年級"].value_counts())
"""
繪製水平條形圖方法barh
引數一：y軸
引數二：x軸
"""
plt.barh(range(x), price, height=0.8, color='steelblue', alpha=0.9)      # 從下往上畫
plt.yticks(range(x),data["年級"].value_counts().index )
plt.ylabel("不同年級")
plt.xlabel("人數分佈")
plt.title("不同區間分佈數量")
for x, y in enumerate(price):
    plt.text(y+100, x+0.1, '%s' % y)
plt.show()


import matplotlib.pyplot as plt
plt.rcParams["font.sans-serif"]=["SimHei"]#輸出影象的標題可以為中文正常輸出
plt.rcParams["axes.unicode_minus"]=False #可以正常輸出圖線裡的負號
name_list = ["評分1","評分2'","評分3", "評分4"]
num_list = [0.912,0.914,0.957,0.851]
num_list1 = [0.976, 0.914,0.916,0.734]

x = list(range(len(num_list)))
total_width, n = 0.6, 3
width = total_width / n
plt.bar(x, num_list, width=width, label="LogisticRegression", fc = "b")

plt.text(x[0],num_list[0],"91.2%",ha='center',va='bottom',fontsize=10)
plt.text(x[1],num_list[1],"91.4%",ha='center',va='bottom',fontsize=10)
plt.text(x[2],num_list[2],"96.7%",ha='center',va='bottom',fontsize=10)
plt.text(x[3],num_list[3],"85.1%",ha='center',va='bottom',fontsize=10)

for i in range(len(x)):
    x[i] = x[i] + width
plt.bar(x, num_list1, width=width, label="RandomForest", tick_label = name_list, fc ="r")
plt.xlabel("不同評分目標型別",fontsize=12)
plt.ylabel("不同模型的準確率大小",fontsize=12)
plt.title("不同評分結果的機器學習演算法模型精度表現",fontsize=15)

plt.text(x[0],num_list1[0],"97.6%",ha='center',va='bottom',fontsize=10)
plt.text(x[1],num_list1[1],"91.4%",ha='center',va='bottom',fontsize=10)
plt.text(x[2],num_list1[2],"91.6%",ha='center',va='bottom',fontsize=10)
plt.text(x[3],num_list1[3],"73.4%",ha='center',va='bottom',fontsize=10)

plt.legend(fontsize=9)
plt.show()

資料比賽專案資料視覺化模組程式碼大全

import numpy as np #匯入資料結構nmupy模組import matplotlib.pyplot as plt #匯入matplotlib影象輸出模組plt.rcParams[\"font.sans-serif\"]=[\"SimHei\"] #輸出影象的標題可以為中文正常輸出plt.rcParams[\"axes.

爬取實習吧與python相關的招聘資訊及資料視覺化(含程式碼)

目錄資料爬取資料處理讀取檔案刪除無意義列刪除重複的值資料視覺化工資資訊視覺化城市資訊視覺化實習時間資訊視覺化 Jieba分詞對職位描述視覺化

pytorch實現mnist資料集的影象視覺化及儲存

如何將pytorch中mnist資料集的影象視覺化及儲存匯出一些庫 import torch import torchvision

從聊城資料湖方案淺談，資料中心為什麼建設視覺化坐席系統

2020年初，國家政府出臺了加快新型基礎設施建設的戰略部署，大資料中心作為新型基礎設施建設的7大領域之一，成為國內各個城市重點關注的建設產業。大資料中心是資料儲存、處理和互動的中心，隨著5G通訊技術

豆瓣讀書top250資料爬取與視覺化

爬蟲–scrapy 題目：根據豆瓣讀書top250,根據出版社對書籍數量分類，繪製餅圖搭建環境

直接從國家統計局上找資料，並分析人口資料變化，做成視覺化圖

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

真正傻瓜式操作：這款國產BI軟體，輕鬆實現資料分析預測與視覺化

最近朋友推薦一款名為Yonghong Desktop的工具，號稱既有BI，又有AI，而且還是免費的，於是二話不說，下載->安裝->啟動產品，一系列操作快速搞定後，馬上就想體驗一下。這裡我們使用天池開放的資料資源裡下載的

大屏資料視覺化使用場景大全-大屏資料視覺化的應用

在如今的大資料時代，很多行業在運作過程中會使用到各種資料也會產生出大量的資料，如果還是採用老方式，使用Excel電子表格軟體去進行資料統計分析，不管是從可操作性還是分析結果的整體可讀性都非常的不理想。但是

為什麼資料分析都選擇視覺化資料而不是文字資料

眾所周知，資訊在傳遞過程中會丟失。比如幾個人在玩資訊傳遞的小遊戲，從第一個接受最初的資訊到最後一個人回答最終的資訊。隨著這種傳播次數的增加，資訊被修改和丟失的內容的概率會增加。常言道一圖勝千言如今，在

拓端tecdat|R語言空氣汙染資料的地理空間視覺化和分析：顆粒物2.5（PM2.5）和空氣質量指數（AQI）

原文連結：http://tecdat.cn/?p=23800 原文出處：拓端資料部落公眾號介紹由於空氣汙染對公眾健康的不利影響，人們一直非常關注。世界各國的環境部門都通過各種方法（例如地面觀測網路）來監測和評估空氣汙染問題。

前程無憂崗位資料爬取+Tableau視覺化分析

一、專案背景隨著科技的不斷進步與發展，資料呈現爆發式的增長，各行各業對於資料的依賴越來越強，與資料打交道在所難免，而社會對於“資料”方面的人才需求也在不斷增大。因此瞭解當下企業究竟需要招聘什麼樣的人

拓端tecdat|Matlab廣義線性模型glm泊松迴歸的lasso、彈性網路正則化分類預測考試成績資料和交叉驗證視覺化

原文連結：http://tecdat.cn/?p=24777 原文出處：拓端資料部落公眾號使用冗餘預測變數構建資料集並使用lasso和 glm識別這些預測變數。

手把手教你用Python爬取某網小說資料，並進行視覺化分析

網路文學是以網際網路為展示平臺和傳播媒介，藉助相關網際網路手段來表現文學作品及含有一部分文字作品的網路技術產品，在當前成為一種新興的文學現象，並快速興起，各種網路小說也是層出不窮，今天我們使用seleniu

Python BeautifulReport視覺化報告程式碼例項

操作步驟 1.下載BeautifulReport檔案，本例檔案下載地址最新檔案下載地址 2.複製檔案BeautifulReport，至python安裝Lib\\site-packages位置下

三階魔方自動求解及動態視覺化matlab程式碼

技術標籤：程式人生經驗分享機器學習演算法matlab 三階魔方自動求解及動態視覺化matlab程式碼

厲害啦，視覺化低程式碼程式設計平臺開源了

厲害啦，視覺化低程式碼程式設計平臺開源了非著名程式設計師公眾號「非著名程式設計師」主理人，程式設計師/復業者/生涯規劃師

打破資訊孤島：LeaRun視覺化低程式碼開發平臺

隨著雲端計算和大資料技術的發展，企業管理系統迎來了新的發展契機，資訊化技術的介入，打破了原有資料管理低效孤立的局面，使資訊共通共享成為可能。出於提升企業管理效益的考慮，不少管理者將目光投向了企業管理

JimuReport v1.5.6版本釋出—免費的視覺化低程式碼報表

專案介紹一款免費的低程式碼視覺化報表，像搭建積木一樣線上拖拽設計！低程式碼開發必備，功能涵蓋，資料報表、列印設計、圖表報表、大屏設計等！

LPL比賽資料視覺化，完成這個專案，用盡了我的所有Python知識

LPL比賽資料視覺化效果圖完成這個專案，我感覺我已經被掏空了，我幾乎用盡了我會的所有知識html+css+javascript+jQuery+python+requests+numpy+mysql+pymysql+json+ajax+flask+echarts在這個過程中，並不是那麼

wxPython繪圖模組wxPyPlot實現資料視覺化

本文例項為大家分享了wxPython繪圖模組wxPyPlot實現資料視覺化的具體程式碼，供大家參考，具體內容如下

資料比賽專案資料視覺化模組程式碼大全

相關推薦