透過2W條評論看動漫《博人傳-火影忍者新時代》

阿新 • • 發佈：2018-12-12

寫在前面

日本電視動畫《BORUTO -火影新世代》（中國大陸譯名《博人傳：火影忍者新時代》）改編自岸本齊史原作並監修、池本幹雄編繪、小太刀右京編劇的同名漫畫，是《火影忍者》系列的續篇，講述原作故事完結後漩渦鳴人之子漩渦博人的冒險故事。動畫的後續劇情將對岸本齊史負責指令碼的劇場版《火影忍者劇場版：博人傳》作出補充。

動畫與前作《火影忍者》《火影忍者疾風傳》一樣由Studio Pierrot（小丑社）負責製作。時間是：2017年4月5日起每週三16：55在東京電視臺系列首播

以上內容，是我從百度百科抄襲過來的~哈哈哈哈，咱主要做的是資料分析，資料的爬取，去我的爬蟲系列的部落格裡面去看吧，裡面有相關的教程。

資料分析

作為評論的資料，咱儲存了這些資料留著備用

    author # 作者
    content # 評論內容
    ctime = # 評論時間
    disliked # 不喜歡人數
    liked # 喜歡
    likes # 奇怪？？？
    score # 打分
    user_season # 在第幾集打的分數
複製程式碼

1.清洗資料

最核心的步驟來了，在分析資料以前，我們需要對資料做一些處理，空值判斷，時間格式修改等內容，這部分可能會根據實際的需求發生一些變化。

import numpy as np
import pandas as pd
import 
 datetime


# 資料讀取
def read_csv():
    file = pd.read_csv("./bore.csv",header=None,names=["author","content","ctime","disliked","liked","likes","score","user_season"])
    return file

# 資料清洗
def clear_data():
    df = read_csv()
    #print(any(df.duplicated())) # 判斷資料是否有重複
    #print(df.head())
    #print(df.isnull().any())  # 判斷是否有空列 

    #print(df[df.isnull().values==True])   # 檢測空值 
    data = df.fillna(0)  # 空值填充 

    # 時間處理
    def get_localtime(data):
        time =  datetime.datetime.fromtimestamp(data['ctime']).strftime("%Y-%m-%d")
        return pd.to_datetime(time)
    df["ctime"]=df.apply(get_localtime,axis = 1)  # apply 的使用 
    
    return df

# 資料分析1
def analsis1(data):
    print(data["author"].describe())

if __name__ == '__main__':
    df = clear_data()
    analsis1(df)

複製程式碼

2.評論最多的人？

看一下誰是這部動漫評論最多的人，這個程式碼非常簡單，參考下面程式碼即可。.describe() 函式

def analsis1(data):
    print(data["author"].describe())
複製程式碼

count     18535  # author總數
unique    18535 # 去除重複之後的總數
top        你的盛世   
freq          1
Name: author, dtype: object
複製程式碼

很神奇，竟然沒有人評論次數超過2 這個結論只能表示，B站允許視訊評論一次？！機制的我想去測試一下，啪啪啪，打臉回來了，我竟然沒有許可權。

※你沒有許可權※

3.評論最多的人？

資料中，有分數的排布，那麼我們看一下打分的柱狀圖吧！資料顯示的1星和5星的比較多，兩級分化比較嚴重。

為了確保中文顯示正常，需要首先配置一下預設字型並且設定一下 matplotlib的樣式

import numpy as np
import pandas as pd
import datetime
import matplotlib.pyplot as plt
import matplotlib.style as psl

psl.use('seaborn-darkgrid')
plt.rcParams['font.sans-serif'] = ['SimHei']  # 用來正常顯示中文標籤
plt.rcParams['axes.unicode_minus']=False
複製程式碼

分組統計score打分，使用groupby(by="欄位名稱").size() # 獲取數量
reset_index(drop=True) # 重置索引
plt.bar #用來生成柱狀圖
plt.text() # 生成文字

def analsis2(data):
    # 文章打分的柱狀圖
    score = data["score"].groupby(data["score"]).size()

    score = score.reset_index(drop=True)
    x_index = np.arange(1,6).tolist()

    plt.bar(x_index,score.values,0.4,color="#03a9da")
    # 繪製文字
    for xx,yy in zip(x_index,score.values):
        plt.text(xx,yy+0.2,str(yy),ha="center",fontsize = 10)

    plt.title("使用者評星圖表")  # 設定標題
    plt.xlabel("評星")  # 設定x軸標識
    plt.ylabel("人數")  # 設定y軸標識
    plt.show()
複製程式碼

如果編寫如下程式碼

plt.barh(x_index, score.values, 0.4, color="#03a9da")  
複製程式碼

就會得到一個橫向的條形柱狀圖。

4. 評論時間分佈

從資料看星期二、四、六評論次數增多，很有意思的資料。

# 通過星期判斷評論次數
def analysis3(data):
    data.set_index(data["ctime"],inplace=True)
    weeks = ["星期日","星期一","星期二","星期三","星期四","星期五","星期六"]
    def get_weekday(data):
        return weeks[data["ctime"].weekday()]
    data["week"] = data.apply(get_weekday,axis=1)
    week_data = data.groupby(by="week")["author"].size()

    plt.bar(weeks,week_data.values,0.5,color="green")
    plt.show()
複製程式碼

5. 評論月份暴漏的部分關係

我們看到在2018年7月份資料忽然升高，這背後到底有啥隱藏的祕密呢？我們繼續往下看。！

def analysis4(data):
    data.set_index(data["ctime"], inplace=True)
    data = data.resample("M").count()["author"]  # 按照月份彙總資料
    data = data.to_period("M")  # 顯示資料
    x = np.arange(0,len(data),1)

    fig = plt.figure(figsize=(6, 4))
    ax = fig.add_subplot(111)

    '''
    fig = plt.figure()
    ax2 = fig.add_subplot(212)
    '''

    ax.plot(x,data.values,"#03a9f4",marker="o",markersize=4)
    ax.set_xticks(x)  # 設定x軸標籤為自然數序列
    ax.set_xticklabels(data.index)  # 更改x軸標籤值為年份
    plt.xticks(rotation=60)  # 旋轉90度，不至太擁擠

    plt.title('博人傳評論數量變化(201709-201812)', color="#03a9f4", fontsize=12)
    plt.xlabel("月份")
    plt.ylabel('評論數量')
    plt.tight_layout()  # 自動控制空白邊緣


    plt.show()

複製程式碼

過濾2018年7月份的資料出來,發現在2018年7月20日的時候，出現了一個評論峰值，在進行細緻的分析，咱看一下資料。

看到這個資料之後，雖然我沒看博人傳，但是，我知道了 65集肯定好看，而且很有可能在7月20日更新的就是這1集，好奇心起來的你，或者你是一個火影迷，你可以去看看這一集~！我翻到評論，引用了一個置頂評論

	本集是值得國人觀眾特別期待的一集，因為這一話（第65集）是由國人原畫師黃成希全權負責的，
	他一個人包攬了本集的分鏡/演出/作畫導演等主要工作。
	換而言之，黃成希作為中國畫師獲得了本集的作監資格。這在火影忍者開播16年以來是史無前例的。
	十幾年前，黃成希在火影忍者剛剛開播時，也和多數人一樣僅僅只是螢幕前的看客，
	但是這部作品對學生時代的他施加了巨大的影響，最終促使黃成希走上了成為動畫畫師的道路。
	在2012年加入日本動畫行業後，他如願以償成為了火影忍者的主力原畫之一，並參與作畫監督的工作。
	除此之外他還先後加入過包括黑子的籃球、妖怪手錶和刀劍神域劇場版等多部作品的製作，
	實力得到了業內的認可，因此才最終獲得了獨自扛下重要打鬥回的資格，如此說來也算是圓夢成功。
	由於本集幾乎是黃成希的個人秀，再加上這一話中大筒木桃式使用了漫畫版而不是劇場版中的新形象，
	因此黃成希在作畫上自由發揮的空間就變得很大，這就有餘地在打鬥中融入太極和詠春等中國傳統武術了。
	所以大夥看到一連串的“中國功夫”也別覺得奇怪哈~
	說起來，大筒木一族本身就有一股濃厚的道家派頭，他們不僅歷史悠久，文明程度遠遠超越這個世界的人，
	而且全族都在種靈根，吃仙桃，脩金丹，求長生不老。現在再配合一整套中國武學架子，
	簡直給人一種徐福手下三千童男童女入蓬萊求仙藥的即視感...將來出一個徐福式的修仙族長也是極好的！（大誤）


	黃成希在博人傳中的幾段作畫（可能有遺漏）:
	博人vs木葉丸
	博人vs花火
	博人vs鵺
	小櫻vs信
	巳月vs屍澄真
複製程式碼

def analysis5(data):
   data = data.set_index('ctime')  # 將時間作為索引
   data = data["2018-07-01":"2018-08-01"]
   child_data = data.resample("D").count()["content"]
   print(child_data.to_period("D"))

   data = data['2018-07-20':"2018-07-20"]
   print(data["content"])

複製程式碼

6. 評論最多的集數

其實有上面的分析，我們已經知道了，65集肯定是評論最多的了，但是我們還是要用資料看一下

def analysis6(data):
    data = data.groupby(by="user_season").size()
    data = data.sort_values(ascending=False)
    print(data.head())

複製程式碼

沒問題，65集必看

集數	評論數量
65	4338
40	985
39	658
66	502
68	494

最後打算在弄一個文字圖的，後來想想下次再說，《博人傳》資料和原始碼已經給大家寫完整啦~

一星給情懷，一星給65集

透過2W條評論看動漫《博人傳-火影忍者新時代》

寫在前面日本電視動畫《BORUTO -火影新世代》（中國大陸譯名《博人傳：火影忍者新時代》）改編自岸本齊史原作並監修、池本幹雄編繪、小太刀右京編劇的同名漫畫，是《火影忍者》系列的續篇，講述原作故事完結後漩渦鳴人之子漩渦博人的冒險故事。動畫的後續劇情將對岸本齊史負責指令碼的劇場版《火影忍者劇場版：博人傳》作

用Python爬了菊姐2W條微博評論，竟發現“菊粉”都是這樣的人！(附程式碼)

關於菊姐為什麼會火，網上有很多文章，我就不再贅述了。今天我們就來做一份菊粉陶淵明的使用者畫像，看看那些 Pick 菊姐的人都有什麼特質？先來看看百度指數，通過百度指數我們看出，菊姐的搜尋熱度在 5 月 30 開始出現頂峰，5 月 31 開始回落。王菊百度指

爬了B站17398條評論，告訴你這部9.7分動漫為什麼大受追捧

導讀：動漫《工作細胞》在b站上評分高達9.7。除了口碑之外，熱度也居高不下，更值得關注的是連很多

爬取 48048 條評論，解讀 9.3 分的「毒液」是否值得一看？

本文轉載自：https://mp.weixin.qq.com/s?__biz=MzA4MjEyNTA5Mw==&mid=2652568697&idx=1&sn=e2e52e392996202b2e4142462594e953&chksm=8464d433b3

爬取了 48048 條評論資料，解讀 9.3 分的《毒液》是否值得一看？

11月，由湯姆·哈迪主演的“毒液：致命守護者”在國內上映，依託漫威的光環以及演員們精湛的演技，這部動作科幻片在貓眼評分得到豆瓣7.4的評分，口碑和票房都高於大多數同期上映的其他影片。所以週日的時候跟基友去電影院去看了這場正邪共生的電影，100多人的影院座無虛席，不過看完之後對比其他漫威作品

帶你去看《一支鉛筆誕生的世界-世界經典動漫原畫展》

2018年的聖誕前夕，200餘幅動漫原畫與珍稀賽璐璐動漫底片首次來到天津市西青區常青藤文化產業園與見面作為ACG愛好者，怎麼能錯過這個大好的機會呢，廢話不多說，這週末趕緊走起首先地點不是很好找，在西青區大學城旁邊，百度地圖上要是不搜尋的話都找不到，旁邊的路也都沒有名字，只能跟

我所看過的n部動漫（n=22）

今天開始囂張了。。。《我是大哥大》作者西森博之。這是一部無甚內涵，卻場面搞笑的動漫，講的是不良少年高中生活，主要是打架。不同於《聖子到》或者《疾風特工隊》，這裡面打架充滿了賤招，主要的樂趣在於看主角這樣用各種看似卑鄙的招數贏得勝利。王勝忠與林貴志，一個刺蝟

《煙花》動漫電影觀後感

bug 想去觀後感 blog 問題體會電影事情簡單中午醒來後就滾去公司讀了幾篇論文，讀的頭腦不清醒。然後聽說最近有一個動漫電影上線了，就一拍即合，和吳隊長一起去看了。看之前和吳隊長都不知道這個電影是什麽，就知道是個日本動漫，不過看到廣告語說：“去年看了你的名字

無限的未知（動漫）

只為 div 個人觀點 class 能力科技發展 log 欲望 logs 即使大人的世界千瘡百孔，但是要讓我們自己來做的話，只能做得更差？所以你看看，船裏的小社會都是什麽樣子的吧。嫉妒、欺騙、恐懼、自暴自棄、憤怒、自私......各種欲望。於是階級分化、工作效率低下。有

十二國記（動漫）

strong 超出似的人物覺悟既然分享圖片就是 cnblogs 誰都不可能只活在自己的世界裏，就能得到救贖。這裏邊，我最敬佩、最喜歡、最向往的人物，毫無疑問，就是珠晶，也就是供王。能感覺到，她是所有的角色中最自信的一位，思考方式也一直比較理性。身為富商

優動漫PAINT繪制紫陽花教程

漫畫 int ucs 而且 get .... mac ges 分享紫陽花是插畫、漫畫很常見的繪畫畫材、這個教程非常好懂、而且很方便就能繪制出漂亮的效果。因為這種花一個月內能變化三種顏色，故而人們賦予它的花語是善變、背叛。教程是簡單，呃.... 沒有優動漫PAI

優動漫PAINT-繪制透明布料教程

作者教程 cdn .so alt int 官網 paint dong 原是一篇日語教程，覺得挺不錯的，就勞煩會日語的朋友幫忙翻譯了，特此分享！希望可以幫助到大家在繪畫上的學習！原教程轉載優動漫官網。作者：JaneMere 相關資訊還可以關註www.dongmansof

優動漫PAINT基礎系列之拾色器教學

顏色前段時間 dong 想要 jpeg gpo don 講解 soft 在優動漫PAINT中有類似Photoshop的拾色器功能麽？在優動漫PAINT中，可以直接輸入顏色數值選擇顏色麽？當然是可以的啦！怎麽呼出拾色器界面~ 看這邊... 前段時間小編有收到一些小夥伴的疑問

優動漫PAINT-超簡單灌木教程

one mage 技術分享 div target 下載 src clas ref 超簡單灌木教程~零基礎神馬的都能神還原哦！優動漫PAINT下載：http://wm.makeding.com/iclk/?zoneid=18597 想要Get到更多有關優動漫的信息包括軟件

jquery 實現拖動文件上傳加進度條

進行 con pos rip file round 默認 dex toupper 通過對文件的拖動實現文件的上傳，主要用到的是HTML5的ondrop事件，上傳內容通道FormData傳輸： //進度條 <div class="parent-dlg" >

優動漫PAINT--草地教程

blog tle 完成分享 clas 中文網站 int 教程 http 本文教學使用優動漫PAINT軟件簡簡單單繪制草地教程，只需要簡單的幾步就可以完成了! 1、先簡單的畫幾筆綠色的大效果； 2、用幾乎一樣的顏色在上面加些斑點； 3、用塗抹工具在邊緣做出草的大體形狀；

是否有一句臺詞，讓你記住了整部動漫？

msh jmp XP lsm mbg jci sbt mcg rdb 是否有一句臺詞，讓你記住了整部動漫？,敘軍發現兩枚戰斧“啞彈”，俄羅斯：成功攔截71枚無誤！,諧遜統燈紀,孩子的獨立性，如此重要！,畢嗆枚毀悠 weibo.com/tijianp/23092798648

中國未來的迪士尼：動漫英雄“呆貍”悄然入市！

動漫概念：動漫產業風靡全球，它指以“創意”為核心，以動畫、漫畫為主要表現形式，包含動畫片、漫畫書、報刊、電影、電視、音像制品、舞臺劇和基於現代信息傳播技術手段的動漫新品種等動漫直接產品的開發、生產、出版、播出、演出和銷售，以及與動漫形象有關的服裝、玩具、電子遊戲等衍生產品的生產和經營的產業，因為有著廣泛的發展

還沒有看完的博客

car art server cnblogs bug crypt hab -s 博客 https://www.cnblogs.com/CareySon/archive/2012/04/01/SQL-SERVER-Encryption.html https://www.cnb

優動漫PAINT安裝教程

動軟 alt 免費試用通過 soft 動畫序列針對性繪畫優動漫PAINT是一款漫畫、插畫、動畫繪制軟件。其功能可分別滿足畫師對於插畫、漫畫和動畫創作的針對性需求，是一款非常好用易上手的動漫繪圖軟件，本文來看使用軟件第一步，如何安裝優動漫PAINT。步驟一下載優

透過2W條評論看動漫《博人傳-火影忍者新時代》

寫在前面

資料分析

1.清洗資料

2.評論最多的人？

3.評論最多的人？

4. 評論時間分佈

5. 評論月份暴漏的部分關係

6. 評論最多的集數

相關推薦