python爬蟲--看看某牙女主播中誰顏值最高，自己動手測測你的顏值

阿新 • • 發佈：2020-12-02

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

以下文章來源於騰訊雲作者：萌萌噠的瓤瓤

( 想要學習Python？Python學習交流群：1039649593，滿足你的需求，資料都已經上傳群檔案流，可以自行下載！還有海量最新2020python學習資料。 )

爬蟲

網頁連結：https://www.huya.com/g/4079
這裡的主要步驟其實還是和我們之前分析的一樣，如下圖所示：

這裡再簡單帶大家看一下就行，重點是我們的第二部分。

既然網頁結構我們已經分析完了，那麼我還是選擇用之前的xpath來爬取我們所需要的資源。

# 
 獲取所有的主播資訊
def getDatas(html):
    datalist=[]
    parse=parsel.Selector(html)
    lis=parse.xpath('//li[@class="game-live-item"]').getall()
    # print(lis)
    for li in lis:
        data = []
        parse1=parsel.Selector(li)
        img_src=parse1.xpath('//img[@class="pic"]/@data-original').get("data 
")
        data.append(img_src)
        title=parse1.xpath('//i[@class="nick"]/@title').get("data")
        data.append(title)
        redu=parse1.xpath('//i[@class="js-num"]/text()').get("data")
        data.append(redu)
        datalist.append(data)
    return datalist

這樣我們就能獲取到我們所需要的所有資源，之後將圖片儲存下來即可。這其中有兩種檔案的下載方式，一種是通過 with open開啟檔案的方式，另外一種就是通過 urllib.request.urlretrieve(data,path) 的方法，網上說第二種方式的下載速度會相對快一點，並且第二種有點 set 集合的意思，可以自動進行去重的操作，下載的資料夾中沒有該檔案就下載，否則就跳過。

#儲存主播頭像
def download(datalist):
    for data in datalist:
        #第一種下載方式
        with open("D:/software/python/python爬蟲/虎牙顏值主播排名/", 'wb') as f:
            f.write(data[0])
        #第二種下載方式
        urllib.request.urlretrieve(data[0],"D:/software/python/python爬蟲/虎牙顏值主播排名"+"/"+data[1]+".jpg")
        print(data[1]+"下載完成")

百度人臉識別介面

百度AI開放平臺連結：https://ai.baidu.com/

輸入相應的應用名稱以及簡介即可。

這樣我們的應用就算建立完畢了。選中的部分也是我們接下來會用到的。

之後我們先去看一下sdk檔案

看使用說明即可，不用著急下載，之後我們直接在pycharm中安裝模組就行。

之後我們來看一下簡單的操作流程首先先建立客戶端：

之後我們就是呼叫介面解析圖片，因為我們需要返回顏值分數這一個引數，所以還需要帶引數進行請求，否則無法將分數資訊返回給我們。如下圖：

這樣我們顏值檢測的介面流程基本就已經理清楚了，程式碼如下：

def face_rg(file_path):
    """ 你的 APPID AK SK """
    APP_ID = '你的 App ID'
    API_KEY = '你的 Api Key'
    SECRET_KEY = '你的 Secret Key'

    client = AipFace(APP_ID, API_KEY, SECRET_KEY)

    with open(file_path,'rb')as file:
        data=base64.b64encode(file.read())


    image=data.decode()

    imageType = "BASE64"

    """ 如果有可選引數 """
    options = {}
    options["face_field"] = "beauty"


    """ 帶引數呼叫人臉檢測 """
    result=client.detect(image, imageType, options)
    # print(result)
    return  result['result']['face_list'][0]['beauty']

之後我們就只需要編寫一個遍歷資料夾下面的圖片進行檢測，之後將整個資訊按照顏值分數進行降序排列：

path=r"D:\software\python\python爬蟲\虎牙顏值主播排名"
image_list=os.listdir(path)
name_score={}
for image in image_list:
    try:
        print(image.split(".")[0]+"顏值評分為:%d"%face_rg(path+"/"+image))
        name_score[image.split(".")[0]]=face_rg(path+"/"+image)
    except:
        pass
second_score=sorted(name_score.items(),key=lambda x:x[1],reverse=True)
print("-------------------------------------檢測結束-------------------------------------")
print("-------------------------------------以下是排名-------------------------------------")
for a,b in enumerate(second_score):
    print("{}的顏值評分為:{},排名第{}".format(second_score[a][0],second_score[a][1],a+1))

python爬蟲--看看某牙女主播中誰顏值最高，自己動手測測你的顏值

爬蟲

效果演示

python爬蟲--看看某牙女主播中誰顏值最高，自己動手測測你的顏值

python爬蟲看看虎牙女主播中誰最“頂”步驟詳解

央視 315 晚會曝光“多位男子冒充女主播誘騙使用者打賞”後，聚享互娛旗下主播伍伍已被抖音封禁

python爬蟲--呼叫某翻譯進行文字翻譯，自己動手製作翻譯器

央視曝直播平臺僱 “聊手”代女主播撩使用者，標註其消費能力等指標

《生化8》吸血鬼夫人身高展示兩位女主播“相形見絀”

直播打賞亂象，男孩沉迷女主播 70 天打賞 158 萬元，法院調解後平臺全額返還

遊戲女主播靠惹火身材吸粉尺度太大被停止廣告營利

女主播養成遊戲《NEEDY GIRL OVERDOSE》主題曲MV公佈

俄羅斯女主播直播過程中遭憤怒鄰居闖入掀翻裝置

遊戲女主播推出“防藍光”護膚品玩家直斥：騙子！

央視 315 晚會曝光：“女主播微信實為男運營專騙粉絲大哥”，聊天內容極為露骨、毫無底線

抓到了！央視 315 晚會曝光男運營冒充女主播涉案公司相關人員落網

國外主播不間斷直播1000小時，打破Twitch紀錄

報告：我國直播主播賬號達 1.3 億，使用者規模超 6 億人

永劫無間：快手遊戲主播Melo登頂三排榜，蟬聯國服榜一

快手主播辛巴：今年將增加自己的直播頻次，辛選員工達 4000 多名

LOL主播圈“說車一哥”，靠評車漲粉7位數，豪華座駕讓水友酸了

【Python基礎程式設計224 ● 面向物件 ● 子類中定義了init()方法，子類如何繼承父類中的屬性】

python爬蟲：爬取某牙直播小姐姐圖片，我的雙手已經按捺不住了

python爬蟲--看看某牙女主播中誰顏值最高，自己動手測測你的顏值

爬蟲

效果演示

相關推薦