Python爬取NBA虎撲球員資料

阿新 • • 發佈：2020-09-11

虎撲是一個認真而有趣的社群,每天有眾多JRs在虎撲分享自己對籃球、足球、遊戲電競、運動裝備、影視、汽車、數碼、情感等一切人和事的見解,熱鬧、真實、有溫度。

受害者地址

https://nba.hupu.com/stats/players

本文知識點：

系統分析網頁性質
結構化的資料解析
csv資料儲存

環境介紹：

python 3.6
pycharm
requests
csv

爬蟲案例的一般步驟

1.確定url地址(網頁分析) 完成一半
2.傳送網路請求 requests(js\html\css)
3.資料解析(篩選資料)
4.儲存資料(本地檔案\資料庫)

部分程式碼

匯入工具

import requests  # 第三方工具
import parsel  # 資料解析工具  (css\正則表示式\xpath)
import csv

確定url地址(網頁分析) 完成一半 (靜態網頁\動態網頁)

url = 'https://nba.hupu.com/stats/players/pts/{}'.format(page)

傳送網路請求 requests(js\html\css)

response = requests.get(url=url)
html_data = response.text

資料解析(篩選資料)

selector = parsel.Selector(html_data)
    trs  
= selector.xpath('//tbody/tr[not(@class="color_font1 bg_a")]')
    for tr in trs:
        rank = tr.xpath('./td[1]/text()').get()  # 排名
        player = tr.xpath('./td[2]/a/text()').get()  # 球員
        team = tr.xpath('./td[3]/a/text()').get()  # 球隊
        score = tr.xpath('./td[4]/text()').get()  # 得分
        hit_shot = tr.xpath(' 
./td[5]/text()').get()  # 命中-出手
        hit_rate = tr.xpath('./td[6]/text()').get()  # 命中率
        hit_three = tr.xpath('./td[7]/text()').get()  # 命中-三分
        three_rate = tr.xpath('./td[8]/text()').get()  # 三分命中率
        hit_penalty = tr.xpath('./td[9]/text()').get()  # 命中-罰球
        penalty_rate = tr.xpath('./td[10]/text()').get()  # 罰球命中率
        session = tr.xpath('./td[11]/text()').get()  # 場次
        playing_time = tr.xpath('./td[12]/text()').get()  # 上場時間
        print(rank, player, team, score, hit_shot, hit_rate, hit_three,
              three_rate, hit_penalty, penalty_rate, session, playing_time)

        data_dict = {
            '排名': rank, '球員': player, '球隊': team, '得分': score,
            '命中-出手': hit_shot, '命中率': hit_rate, '命中-三分': hit_three, '三分命中率': three_rate,
            '命中-罰球': hit_penalty, '罰球命中率': penalty_rate, '場次': session, '上場時間': playing_time}

        csv_write.writerow(data_dict)
                
        #  想要完整原始碼的同學可以關注我的公眾號：松鼠愛吃餅乾
        #  回覆“虎撲NBA”即可免費獲取

執行程式碼，效果如下

Python爬取NBA虎撲球員資料

Python爬取QQ音樂榜單資料

1、爬取QQ音樂榜單資料並存入資料庫（MySQL） 2、程式碼 import requests import json from bs4 import BeautifulSoup

Python爬取北京地區蛋殼公寓資料，並進行資料視覺化處理

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

Python爬取獵聘網的資料進行分析

前言：一、選題的背景　　　近年來，越來越多的年輕人在尋找工作這個方面呢的事情上會出現各種問題，而好的工作非常難找，差的工作很多年輕人也不想做，所以我選擇做一份資料分析一下招聘網站上各個工作的情況。

Python-爬取新浪每日熱門資料

1. 初實現最初是計劃爬取頁面後，使用xpath進行資料解析，並輸出至檔案程式碼如下：

Python爬取資料並寫入MySQL資料庫的例項

首先我們來爬取 http://html-color-codes.info/color-names/ 的一些資料。按 F12 或 ctrl+u 審查元素，結果如下:

用python爬取歷史天氣資料的方法示例

某天氣網站（www.數字.com）存有2011年至今的天氣資料，有天看到一本爬蟲教材提到了爬取這些資料的方法，學習之，並加以改進。

python 爬取疫情資料的原始碼

疫情資料程式原始碼 // An highlighted block import requests import json class epidemic_data(): def __init__(self,province):

Python爬取新型冠狀病毒“謠言”新聞進行資料分析

一、爬取資料話不多說了，直接上程式碼（ copy即可用） import requests import pandas as pd

Python爬取YY評級分數並儲存資料實現過程解析

前言當需要進行大規模查詢時（比如目前遇到的情形：查詢某個省所有發債企業的YY評級分數），人工查詢顯然太過費時，那就寫個爬蟲吧。

Python網路爬蟲第三彈《爬取get請求的頁面資料》

Python網路爬蟲第三彈《爬取get請求的頁面資料》一.urllib庫　　urllib是Python自帶的一個用於爬蟲的庫，其主要作用就是可以通過程式碼模擬瀏覽器傳送請求。其常被用到的子模組在Python3中的為urllib.reque

基於Python爬取fofa網頁端資料過程解析

FOFA-網路空間安全搜尋引擎是網路空間資產檢索系統（FOFA）是世界上資料覆蓋更完整的IT裝置搜尋引擎，擁有全球聯網IT裝置更全的DNA資訊。探索全球網際網路的資產資訊，進行資產及漏洞影響範圍分析、應用分佈統計、應

Python爬取分析B站動漫《柯南》彈幕，從資料中分析接下來的劇情

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理。

用Python 爬取貓眼電影資料分析《無名之輩》

前言作者：羅昭成 PS：如有需要Python學習資料的小夥伴可以加點選下方連結自行獲取

Python爬取資料並實現視覺化程式碼解析

這次主要是爬了京東上一雙鞋的相關評論：將資料儲存到excel中並可視化展示相應的資訊

使用Python爬取COVID-19疫情資料

1. 選擇資料來源自新冠肺炎(covid-19)疫情爆發以來，這場疫情幾乎影響了每個人的生活，為了對疫情做資料分析，需要採集疫情的資料，本篇案例就基於python爬蟲進行資料採集。

利用Python爬取疫情資料並使用視覺化工具展示

import requests, json from pyecharts.charts import Map, Page, Pie, Bar from pyecharts import options as opts

Python爬取食品商務網蔬菜價格資料，看看蔬菜最近的價格情況

前言蔬菜是指可以做菜、烹飪成為食品的一類植物或菌類，蔬菜是人們日常飲食中必不可少的食物之一。近期，蔬菜價格有所上漲，引起廣泛關注。“雙節”將至，物價走勢如何？9月16日，國家發改委召開9月份例行

python爬取資料並可視化展現

#將excel中的資料進行讀取分析 import openpyxl import matplotlib.pyplot as pit #資料統計用的

Python爬取股票資訊，並可視化資料的示例

前言截止2019年年底我國股票投資者數量為15975.24萬戶,如此多的股民熱衷於炒股,首先拋開炒股技術不說,那麼多股票資料是不是非常難找,找到之後是不是看著密密麻麻的資料是不是頭都大了?

Python爬取NBA虎撲球員資料

部分程式碼

相關推薦