通過Appium+mitmproxy爬取快手短視訊，並將爬取資訊存入mongodb資料庫

阿新 • • 發佈：2021-08-06

一、目標

通過appium模擬滑動快手發現頁中的視訊，通過mitmproxy代理抓取視訊資訊，存入mongodb資料庫中

二、步驟

通過fiddler抓包工具分析介面
- 先通過fiddler抓包工具，分析並獲取到視訊資料的api，發現視訊資訊api中包含“rest/n/feed/hot”。然後將返回的json資料通過json.cn網站進行開啟分析，解析想要的資料，並編寫mitmproxy的腳步，存入mongodb資料庫。

編寫mitmproxy指令碼

# coding:utf-8
import pymongo
import json

#mongodb資料庫連線
client = pymongo.MongoClient(host=' 
主機名',port=27017)
db = client['kuaishou']
collection = db['video_info']

def response(flow):
    if 'rest/n/feed/hot' in flow.request.url:
        info_dict = json.loads(flow.response.text)
        infos = info_dict.get('feeds')
        for info in infos:
            video_info = {}
            video_info[ 
'user_id'] = info['user_id'] #使用者id
            video_info['user_name'] = info['user_name'].strip()#使用者名稱
            video_info['title'] = info['caption'] #標題
            video_info['video_url'] = info['main_mv_urls'][0]['url'] #視訊地址
            video_info['duration'] = int(info['duration']/1000) #視訊時長
            video_info[' 
view_count'] = info['view_count'] #觀看數
            video_info['share_count'] = info['share_count'] #分享數
            video_info['comment_count'] = info['comment_count'] #評論數
            video_info['like_count'] = info['like_count'] #喜歡數
            video_info['unlike_count'] = info['unlike_count'] #不喜歡數
            video_info['share_info'] = info['share_info'] #分享資訊
            collection.replace_one({'video_url':video_info['video_url']},video_info,True) #存入資料庫，有則替換，沒有則插入

編寫爬蟲指令碼

# coding:utf-8
import time
from appium.webdriver import Remote
from selenium.webdriver.support.ui import WebDriverWait as WAIT

# desired_capabilities
cap = {
  "platformName": "Android",
  "platformVersion": "5.1.1",
  "deviceName": "127.0.0.1:62001",
  "appPackage": "com.smile.gifmaker",
  "appActivity": "com.yxcorp.gifshow.HomeActivity",
  "noReset": True,
  "unicodeKeyboard": True,
  "keyboardReset": True
}

def get_size(driver):
    '''獲取頁面視窗大小'''
    size = driver.get_window_size()
    return size['width'],size['height']


driver = Remote('http://127.0.0.1:4723/wd/hub',desired_capabilities=cap) #appium客戶端連線


#點選彈窗---青少年模式下的我知道了
try:
    i_know = WAIT(driver, 400).until(lambda x:x.find_element_by_android_uiautomator('new UiSelector().className(\"android.widget.TextView\").textContains(\"我知道了\").resourceId(\"com.smile.gifmaker:id/positive\")'))
    i_know.click()
except:
    pass


time.sleep(2)
size = get_size(driver) #獲取快手介面大小

#滑動的起止位置，從中間下方80%的位置滑動到上方20%的位置
x = int(size[0]*0.5)
y_start = int(size[1]*0.8)
y_end = int(size[1]*0.2)

#模擬滑動20次
for i in range(20):
    driver.swipe(x,y_start,x,y_end,200) #滑動時間200 ms
    time.sleep(1)

寫個腳步下載視訊

# coding:utf-8
import requests
import pymongo
import os
import time
import re

headers = {
    'UserAgent':'Mozilla/5.0 (Windows NT 6.1; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.124 Safari/537.36'
}
client = pymongo.MongoClient(host='主機名',port=27017)
db = client['kuaishou'] #指定資料庫名
collection = db['video_info'] #指定集合名

#視訊儲存位置
if not os.path.exists('./videos'):
    os.mkdir('./videos')

video_infos = collection.find({}) #返回的是一個iterator

for video_info in video_infos:
    video_url = video_info['video_url']
    video_name = re.search(r'clientCacheKey=(.*?\.mp4)',video_url).group(1)
    data = requests.get(video_url,headers=headers).content
    with open('./videos/'+video_name,'wb') as f:
        f.write(data)
    time.sleep(1)

通過Appium+mitmproxy爬取快手短視訊，並將爬取資訊存入mongodb資料庫

一、目標通過appium模擬滑動快手發現頁中的視訊，通過mitmproxy代理抓取視訊資訊，存入mongodb資料庫中

Appium在快手短視訊APP上刷金幣

一、環境搭建 1.準備Android真機一臺我這使用的是三星Galaxy S6 edge，Android版本為7.0。

Python批量爬取糗事百科短視訊，有意思的視訊還是蠻多的

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

python爬取某音小姐姐短視訊，今天帶你全自動下載！

本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,版權歸原作者所有,如有問題請及時聯絡我們以作處理

2021最新版Python爬取抖音小姐姐短視訊，無水印，超級詳細！（附視訊/原始碼）

好了，又來到了大家最喜歡的整活環節，爬小姐姐視訊，本來爬正經視訊的，但是想了想，還是要整點實用的，那必須換成小姐姐，直接整活！

Python爬取B站視訊，只需一個B站視訊地址，即可任意下載

前言本文的文字及圖片來源於網路,僅供學習、交流使用,不具有任何商業用途,如有問題請及時聯絡我們以作處理。

手把手帶你從零基礎抓取A站短視訊，並且製作從動態桌布，這些小姐姐我全都要！

大家好，我是辣條。我知道大家都是衝著學技術來的，肯定不是為了那些好看的小姐姐進來的，所以直接進入主題吧。

Python 帶你高效創作短視訊，視訊創作秀到飛起！！！

近兩年，抖音、快手將短視訊推到風口浪尖上，要生產出高質量的視訊，離不開視訊剪輯這一環節；在全民剪片浪潮中，大眾使用最多的剪輯軟體如：Pr、FCPX、剪印、Vue 等。

美圖上市近 5 年：丟了手機、錯失短視訊，如今買幣自救

在高調宣佈投資加密貨幣數週後，美圖釋出了 2020 年全年財報。財報顯示，美圖 2020 年全年營收 11.9 億元，同比增長 22%，淨虧損收窄至 4100 萬元，而上年同期虧損為 3.965 億元。

聯合“優騰”對抗短視訊，能救愛奇藝嗎

從賣身風波到倒奶事件，去年以來，愛奇藝似乎一直未能走出多事之秋。一系列動盪直接反映到公司股價上。截止到 6 月 8 日，愛奇藝報價 14.08 美元，此前最低點一度達 12.14 美元，目前最新總市值為 111.2 億美元。

電腦也能刷短視訊，抖音網頁版詳細體驗

許多網友都想在電腦裡刷抖音，可是以前想在電腦裡刷抖音，那就得裝個安卓模擬器。現在好了，來自官方的抖音網頁版來啦，終於在電腦裡也可以輕鬆刷抖音了，趕緊來看看這個網頁版好用不。抖音網頁版在哪抖音網頁版官方

抖音電腦版上架微軟 Win11 / Win10 應用商店：大屏刷短視訊，支援自動切換

感謝網友肖戰割割的線索投遞！

Python爬蟲爬取京東某商品評論資訊存入mysql資料庫

1 \"\"\" 2 https://club.jd.com/comment/productPageComments.action?callback=fetchJSON_comment98&productId=100006852812&score=0&sortType=5&page=0&pageSize=10&isShadowSku=0&f

通過Openssl提供FTP+SSL/TLS認證功能，並實現安全資料傳輸

注：通過筆者”FTP伺服器工作原理及如何通過PAM認證實現虛擬使用者登入“博文，我們瞭解到FTP是一種檔案共享協議，而且使用的是明文傳輸機制，所以在網際網路上傳輸使用者和密碼是不安全的，所以要採用S

pandas讀取csv，並進行Series取值操作

技術標籤：pandasPython基礎知識pandasread_csv 程式碼示例： #讀取CSV import pandas as pd df1 = pd.read_csv(\'test.csv\')

Android 版 YouTube 已支援在低解析度裝置上播放 4K 視訊，並可流式傳輸 - IT之家

2月20日訊息長期以來，不論顯示器是否支援高解析度，YouTube 都允許使用者在臺式機上對高解析度視訊進行流式傳輸。例如，全高清顯示器的使用者能夠流式傳輸 4K 或更高清的視訊。但是，Android版 YouTube 卻不支援該功

php抓取網頁body內容，並過濾網頁標籤

php只抓取網頁文字內容，並過濾其標籤，說幹就幹，開始！ <?php function curl_request ( $url , $post = \'\' , $cookie = \'\' ,$returnCookie = 0 ) {

Pixel 手機可在緊急情況下自動錄製和上傳視訊，並可分享給聯絡人

10 月 1 日消息穀歌為其 Pixel 安卓手機獨家提供個人安全（Personal Safety）應用程式，該應用增加了一些功能，如安全簽到，如果使用者沒有按計劃迴應，就會自動通知使用者的緊急聯絡人，如果檢測到使用者發生了車禍

《葫蘆兄弟》等六部經典動畫 4K 修復版上線西瓜視訊，並免費向公眾開放修復技術

10 月 20 日訊息，位元組跳動經典中視訊 4K 修復釋出會今日在北京舉行。西瓜視訊聯合火山引擎宣佈，將在未來一年內修復 100 部經典動畫片，用技術最大程度還原這些作品。▼ 修復前▼ 修復後位元組跳動表示，6 部經典

java查詢的資料返回給jsp頁面，通過jstl來獲取後端頁面資料，並顯示資料

JSTL JSP Standard Tag Library 標準標籤庫 JSTL允許開人員可以像使用HTML標籤那樣在JSP中開發Java功能。JSTL庫有core, i18n, fmt, sql 等等。

通過Appium+mitmproxy爬取快手短視訊，並將爬取資訊存入mongodb資料庫

一、目標

二、步驟

通過fiddler抓包工具分析介面

編寫mitmproxy指令碼

編寫爬蟲指令碼

寫個腳步下載視訊

相關推薦