Python資料分析（jupyter notebook上實現）

阿新 • • 發佈：2020-12-24

import pandas as pd
import matplotlib.pyplot as plt


plt.rcParams['font.sans-serif'] = ['SimHei']  # 用來正常顯示中文標籤
plt.rcParams['axes.unicode_minus'] = False  # 用來正常顯示負號

data = pd.read_csv('movie.csv')
data.dropna(inplace=True)





# 1.電影時⻓與受歡迎程度的關係分析

x = data
x1 = x['duration']
x2 = x['cast_total_facebook_likes 
']
x2.head()
x3 = x['movie_facebook_likes']
plt.scatter(x1,x2)
plt.scatter(x1, x3)
plt.xlabel('電影時長')
plt.legend(('喜愛人數', '點贊人數')) 








# 2.評分排名前20位的導演

x = data
x.sort_values(by='imdb_score', ascending=False).head(20)['director_name']

# 3.拍攝電影數量最多的前10位導演

x = data
res = x.groupby('director_name').count().sort_values(by=' 
color', ascending=False).head(10)
res.index

# 4.票房排名前10位的導演

x = data
x.groupby('director_name').sum().sort_values(by='gross', ascending=False).head(10).index

# 5.票房排名前5位的男⼀號演員姓名

x = data
x.groupby('actor_1_name').sum().sort_values(by='gross', ascending=False).head(5).index

# 6.排名前10位最受歡迎的男⼀號演員

x = data
x.groupby( 
'actor_1_name').sum().sort_values(by='actor_1_facebook_likes', ascending=False).head(10).index

# 7.電影票房的變化趨勢

x = data
x1 = data['gross']
x2 = data['title_year']
plt.scatter(x2, x1)
plt.xlabel('年份')
plt.ylabel('票房')

# 8.電影票房與電影時⻓的關係分析

x = data
x1 = data['gross']
x2 = data['duration']
plt.scatter(x2, x1)
plt.xlabel('電影時長')
plt.ylabel('票房')

# 9.電影評分與電影受歡迎程度分析

x = data
x1 = data['imdb_score']
x2 = data['cast_total_facebook_likes']
x3 = data['movie_facebook_likes']
plt.scatter(x1, x2)
plt.scatter(x1, x3)
plt.xlabel('電影評分')
plt.legend(('喜愛人數', '點贊人數')) 

# 10.電影評分與票房有何關係

x = data
x1 = data['imdb_score']
x2 = data['gross']
plt.scatter(x1, x2)
plt.xlabel('電影評分')
plt.ylabel('票房')

# 11.電影出品量前10的排名橫向柱狀圖

x = data
res = x.groupby('director_name').count().sort_values(by='color',ascending=False).head(10)['color']
res.plot(kind='barh')

# 12.電影出品量變化趨勢

x = data
x.groupby('title_year').count()['color'].plot(kind='line')

Python資料分析（jupyter notebook上實現）

import pandas as pd import matplotlib.pyplot as plt plt.rcParams[\'font.sans-serif\'] = [\'SimHei\']# 用來正常顯示中文標籤

【python資料分析（12）】Pandas實現對Excel列表資料整合（merge縱向合併、concat橫向連線）

1. 背景在進行表格操作的時候，經常需要將兩個excel表格資料進行橫向合併，或者對原有的資料進行縱向擴充，這時候，就可以使用Pandas裡面的 merge 縱向合併和 concat 橫向連線功能了，如下：

python資料分析（八） python pandas--series和dataframe的方法，排序，統計

排序根據條件對結果進行排序，是pandas當中的一個重要方法，pandas提供了兩種排序方式，根據index值，或是根據其中的value進行排序

小渣渣學習筆記 python資料分析（pandas）待續。。

chapter1 ：Pandas DataFrame 基礎知識 2021.6.22 一、載入資料集 #read_csv 函式載入csv檔案（head取前5條）

python資料分析（pandas入門）

1、pandas資料結構之DataFrame DataFrame生成方式：1、從另一個DataFrame建立。2、從具有二維形狀的NumPy陣列或陣列的複合結構生成。3、使用Series建立。4、從CSV之類檔案生成。下面介紹DataFrame的簡單用法：

python資料分析&自動化辦公實戰(二）：批量輸入輸出excel檔案

此篇起皆為實戰總結，以程式碼+註釋+相關總結為主，基礎語法請自行學習，注意各種資料型別間的不同就好。

基於python實現微信好友資料分析（簡單）

一、功能介紹本文主要介紹利用網頁端微信獲取資料,實現個人微信好友資料的獲取,並進行一些簡單的資料分析，功能包括：

Python實現資料分析（二）

Matplotlib的概念和簡單應用一、Matplotlib的概念 Matplotlib 是 Python 的繪相簿。它可與 NumPy 一起使用，提供了一種有效的 MatLab 開源替代方案。它也可以和圖形工具包一起使用，如 PyQt 和 wxPython。

windows上徹底刪除jupyter notebook的實現

windows刪除jupyter notebook 沒辦法的辦法 pip uninstall jupyter -y pip uninstall jupyter_core -y

VScode連線遠端伺服器上的jupyter notebook的實現

工欲善其事，必先利其器，開發工具這個東西覺得折騰下還是有好處的。但常常感覺專門抽出時間搞這個浪費時間，更常見的現象是已經明顯感覺到當前的開發工具用的很彆扭，而且告訴自己等這個忙完了要搭一個更方便的工具

python 資料分析實現長寬格式的轉換

我就廢話不多說了，大家還是直接看程式碼吧！ # encoding=utf-8 import numpy as np import pandas as pd

Python資料分析的幾種繪圖方式——資料視覺化（附原始碼）

前言資料分析初始階段，通常都要進行視覺化處理。資料視覺化旨在直觀展示資訊的分析結果和構思，令某些抽象資料具象化，這些抽象資料包括資料測量單位的性質或數量。本章用的程式庫matplotlib是建立在Numpy之上的一

利用python進行資料分析（第二版）筆記

Numpy 1、建立ndarray物件 1、arr.ndim：Numpy陣列維度資訊 2、arr.shape：Numpy陣列形狀資訊

Python資料分析課--第三節 Jupyter使用

Jupyter介紹 Jupyter Notebooks 是什麼？ Jupyter Notebooks 是一款開源的網路應用，我們可以將其用於建立和共享程式碼與文件。其提供了一個環境，你無需離開這個環境，就可以在其中編寫你的程式碼、執行程

Python資料分析實戰（1）資料分析概述

作者：Corley 源自：快學python 一、入門資料分析 1.大資料時代的基本面大資料產業發展現狀：現在資料已經呈現出了爆炸式的增長，每一分鐘可能就會有：

Python 資料分析之逐塊讀取文字的實現

背景《利用Python進行資料分析》，第 6 章的資料載入操作 read_xxx，有 chunksize 引數可以進行逐塊載入。

pandas frame 刪除一行_利用Python進行資料分析（第五章、Pandas入門）【三】

技術標籤：pandas frame 刪除一行pandas loc 正則匹配pandas reindexpython中series怎麼重建索引

Python資料分析與展示（學習筆記）

目錄1.Python語言開發工具選擇①IPython2.Numpy庫入門①資料維度②資料維度的 Python表示③NumPy的資料物件：ndarray（1）NumPy介紹（2）NumPy的引用（3）N維陣列物件：ndarray（4）ndarray例項（5）ndarray物件的屬

Python訓練營——寶可夢資料分析（2020.10.23）

Python訓練營——寶可夢資料分析分析好抓的寶可夢我們通過免費計算資源且預置了許多常用資料分析依賴庫的DSW探索者版來幫助完成分析的過程。資料集下載

Python 資料分析微專業課程--專案08 中國姓氏排行研究1.專案說明2.專案具體要求3.實現思路：4.實現過程：5.總結

1.專案說明對姓氏戶籍地和工作地資料進行清洗、整合，獲得姓氏的戶籍城市及其經緯度，工作地城市及其經緯度。然後對資料進行分析，分析姓氏TOP20，取其中某幾個姓氏分析其在全國的分佈，根據戶籍地與工作地的經緯度

Python資料分析（jupyter notebook上實現）

相關推薦