使用Appium批量抓取抖音無水印視訊

阿新 • • 發佈：2018-12-28

#coding = utf-8
import os
import time
import re
import aiohttp
import asyncio
import requests
import subprocess
from appium import webdriver
from bs4 import BeautifulSoup

class Spider(object):
    def __init__(self,desired_caps = None,douyin_name = None):
        if not desired_caps:
            desired_caps = {}
            desired_caps['platformName'] = 'Android'
            desired_caps['platformVersion'] = '7.1.2'
            desired_caps['deviceName'] = '你的名稱'
            desired_caps['appPackage'] = 'com.ss.android.ugc.aweme'
            desired_caps['appActivity'] ='.main.MainActivity'
            desired_caps['noReset'] = True
        self.desired_caps = desired_caps
        if not douyin_name:
            douyin_name = "doumiaoya1995"
        self.douyin_name = douyin_name
        self.index = 0
        self.video_urls = []
        self.reg = r"(http://v.douyin.com.*?) "
        self.headers = {"user-agent":"Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like Gecko) Version/11.0 Mobile/15A372 Safari/604.1",}

    def start_appium_clipboard(self):
        self.driver = webdriver.Remote('http://localhost:4723/wd/hub', self.desired_caps)
        time.sleep(5)
        os.popen("adb shell  am startservice ca.zgrs.clipper/.ClipboardService")
        self.driver.tap([(100, 100)], 200)  #點選搜尋符號
        time.sleep(0.5)  #等待載入
        self.driver.tap([(500, 150)], 200)  #點選搜尋框，設定游標
        time.sleep(1)
        #輸入抖音號
        self.driver.find_element_by_xpath("//android.support.v4.view.ViewPager[contains(@index,0)]").send_keys(self.douyin_name)  
        self.driver.find_element_by_id("com.ss.android.ugc.aweme:id/a_x").click()  # 點選搜尋，更新版本後id/a_x 會有變化
        time.sleep(5)  #等待載入
        self.driver.tap([(500, 500)], 200)  #點選進入主頁
        time.sleep(5)  #等待載入
        text = self.driver.find_element_by_id("com.ss.android.ugc.aweme:id/title").get_attribute("text")
        self.total = int(text.split()[-1])   #獲取視訊總數
        self.driver.tap([(100, 1500)], 200)  #點選第一個視訊，進入視訊頁面
        
    def get_url_from_clipboard(self):
        order = "adb shell am broadcast -a clipper.get"
        pi= subprocess.Popen(order,shell=True,stdout=subprocess.PIPE)
        clipboard_text = pi.stdout.read().decode("utf-8")
        url,*_ = re.findall(self.reg,clipboard_text)
        return url

    def get_video_url(self):
        self.start_appium_clipboard()
        while self.index < self.total:
            time.sleep(0.5)
            self.driver.tap([(999, 1499)], 100)   #點選分享按鈕
            time.sleep(1)
            self.driver.swipe(999,1641,20,1641)   #向右滑動，調出複製按鈕
            time.sleep(0.5)
            self.driver.tap([(500, 1700)], 100)   #點選複製按鈕
            url = self.get_url_from_clipboard()
            self.video_urls.append(url)
            os.popen('adb shell am broadcast -a clipper.set -e text ""')  #清除剪下板內容
            time.sleep(0.2)
            self.driver.swipe(500,1500,500,200)
            self.index += 1
        os.popen('adb shell am broadcast -a clipper.set -e text ""')
            
    def get_nowatermark_video_url(self):
        urls = self.video_urls[:]
        self.video_urls = []
        self.index = 1
        for url in urls:
            html = requests.get(url,headers = self.headers).text
            Soup = BeautifulSoup(html,"html.parser")
            url = Soup.select_one("div > video[src]")
            url = url['src']
            url = url.replace("playwm","play")
            self.video_urls.append(url)
            time.sleep(5)
        

    async def get_video_content(self,url):
        async with aiohttp.ClientSession() as session:
            response = await session.get(url,headers=self.headers)
            content = await response.read()
            return content
        
    async def download_video(self,url):
        content = await self.get_video_content(url)
        video_name = "E:\\" + str(self.index) + ".mp4"
        with open(video_name,"wb") as fp:
            fp.write(content)
        print ("第{}個視訊下載成功".format(self.index))
        self.index += 1

    
    def run(self):
        self.get_video_url()
        self.get_nowatermark_video_url()
        print ("準備開始下載")
        start = time.time()
        tasks = [asyncio.ensure_future(self.download_video(url)) for url in self.video_urls]
        loop = asyncio.get_event_loop()
        loop.run_until_complete(asyncio.wait(tasks))
        end = time.time()
        print('共運行了%s秒' % (end-start))

if __name__ == "__main__":
    douyin = Spider(douyin_name = "1641028376")
    douyin.run()

使用Appium批量抓取抖音無水印視訊

#coding = utf-8 import os import time import re import aiohttp import asyncio import requests import subprocess from appium import webdriver from bs4

抖音無水印視訊解析思路

> 本文前半部分是分析過程，只看思路的為節省時間建議直接拉到末尾。 > 本文寫於2020年9月8日，不保證此方法在以後的有效性。 ## 分析過程首先從抖音客戶端找一個視訊，點選分享-複製連結，貼上一下發到電腦上，準備進行下一步，這裡已經準備好了一個從客戶端得到的分享文字。 > 聽說集

使用python-requests+Fiddler4+appium爬蟲,批量爬取抖音小視訊

抖音很火，大家都知道，樓主決定使用python爬取抖音小視訊，人家都說天下沒有爬不到的資料，so，樓主決定試試水，純屬技術愛好，分享給大家。。 1.樓主首先使用Fiddler4來抓取手機抖音app這個包，具體配置的操作，網上有很多教程供大家參考。上面得出抖音的視訊的url，這些url均能在網頁中

使用python爬蟲,批量爬取抖音app視訊

使用python爬蟲,批量爬取抖音app視訊（requests+Fiddler+appium）抖音很火，樓主使用python隨機爬取抖音視訊，並且無水印下載，人家都說天下沒有爬不到的資料，so，樓主決定試試水，純屬技術愛好，分享給大家。。 1.樓主首先使用Fiddler4來抓取手機抖音

python爬取無水印抖音小姐姐視訊(2018最新,含Pyqt客戶端)

各位小夥伴，之前一段時間迷上了抖音小姐姐視訊，但是下載的視訊都有水印，於是自己用Python 寫了個爬取小姐姐視訊的工具，大家可以直接拷貝到自己編譯器上執行。此外，我還利用pyqt5寫了個操作介面，這樣可以方便不懂程式碼的人使用。後面程式碼我都會一一貼上來。備註

國際版抖音，Tiktok爬蟲，無水印視訊批量採集實現分析

頭條系的產品真的很讓人中毒，抖音在國內火的一塌糊塗，海外版的抖音TikTok也讓老外淪陷了。今天談談海外版本的TikTok批量採集的思路。話不多說，先放三張圖鎮鎮場子。搜尋使用者功能

爬蟲進階教程：抖音APP無水印視訊批量下載

本文轉自：https://cuijiahua.com/blog/2018/03/spider-5.html 爬蟲進階教程：抖音APP無水印視訊批量下載摘要本文為兩類人準備：技術控和工具控。如果你是工具控

利用python爬蟲實現：抖音短視訊無水印視訊下載

各位小夥伴，之前一段時間迷上了抖音小姐姐視訊，但是下載的視訊都有水印，於是自己用Python 寫了個爬取小姐姐視訊的工具，大家可以直接拷貝到自己編譯器上執行。經過半天的琢磨，自己用python搞出來一個根據抖音分享視訊連結去除水印並下載的功能。此外，我還利用pyqt5寫了

怎麽用Python爬取抖音小視頻? 資深程序員都這樣爬取的(附源碼)

aid option rip size with open url var mark open 簡介抖音，是一款可以拍短視頻的音樂創意短視頻社交軟件，該軟件於2016年9月上線，是一個專註年輕人的15秒音樂短視頻社區。用戶可以通過這款軟件選擇歌曲，拍攝15秒的音樂短視頻

Python批量抓取商品數據

Python批量抓取商品數據（批量抓取pids.csv文件中商品數據）pids.csv 文件內容：pid733641371225907336415 報錯：解決後代碼： Python批量抓取商品數據

利用Python批量抓取京東評論數據

() 開始 book for return SQ 數據返回 python js對象京東圖書評論有非常豐富的信息，這裏面就包含了購買日期、書名、作者、好評、中評、差評等等。以購買日期為例，使用Python + Mysql的搭配進行實現，程序不大，才100行。相關的解釋我都在

Hibernate_day04---HQL查詢、QBC查詢、多表查詢、檢索策略、批量抓取

一、Hibernate查詢方式及結果存放查詢方式（五種） 1）物件導航查詢：一對多中，查詢某個"一"對應的所有"多" 2）OID查詢：根據id查詢某一條記錄，返回物件 3）HQL查詢：使用Query物件，內建hql語句實現查詢。 4）QBC查詢：使用Criter

Python爬取抖音APP，竟然只需要十行程式碼

環境說明環境： python 3.7.1 centos 7.4 pip 10.0.1 部署 [[email protected] ~]# python3.7 --version Python 3.7.1 [[email protected] ~]#

爬蟲爬取抖音熱門音樂

爬取抖音的熱門音樂詳細程式碼在下面響應體內容工作流預設情況下，當你進行網路請求後，響應體會立即被下載。你可以通過 stream 引數覆蓋這個行為，推遲下載響應體直到訪問 Response.content 屬性： tarb

教你爬取抖音甜曲《好喜歡你》，感受荷爾蒙的氣息

最近發現一首很火的歌，瞬間讓你感受到濃濃的青春懵懂感，這就是王廣允的《好喜歡你》。說實話，爬這種愛意濃濃的歌曲似乎不是我們這種單身XX應有的想法，但是還是想體會一下那些青春歲月裡的小幸福，話不多說，程式碼走起來。本來想這裡直接貼上歌曲的連結，但是由於版權問題，大家可以去網易雲

Hibernate檢索策略及批量抓取

檢索策略的概念　　1 hibernate檢索策略分為兩類：　　（1）立即查詢：根據id查詢，呼叫get方法，一呼叫get方法馬上傳送語句查詢資料庫 //根據cid=1客戶 //執行get方法之後，是否傳送sql語句 //呼

Node 批量抓取並下載某站點的圖片

批量抓取網站圖片並儲存在本地目標網站：妹子圖（點進去別忘了回來~~）專案功能：批量下載該網站的相簿姊妹專案：批量爬取並下載頭條視訊啟動專案命令 npm i npm start 配置檔案 // 配置相關 module.exports = { ori

使用python爬取抖音app視訊

記錄一下如何用python爬取app資料，本文以爬取抖音視訊app為例。程式設計工具：pycharmapp抓包工具：mitmproxyapp自動化工具：appium執行環境：windows10思路：假設已經配置好我們所需要的工具1、使用mitmproxy對手機app抓包獲取我

抖音去掉水印

一、想法由來個人一直比較喜歡抖音上面有創意的小視訊，但無奈水印太多，故想去之留片乾淨的土地！二、具體操作 (1)複製抖音app原始連結，例如這個 (2)選擇網址解析下載:http://nopapp.com/Home/DouYin (2)第二網址 https://douy

爬取抖音Top20視訊，並自動播放

from time import sleep from glob import iglob from requests import get from natsort import natsorted from win32api import ShellExecute from moviepy.ed

使用Appium批量抓取抖音無水印視訊

相關推薦