Python破解BiliBili滑塊驗證碼的思路詳解(完美避開人機識別)

阿新 • • 發佈：2020-02-17

準備工作

B站登入頁 https://passport.bilibili.com/login
python3
pip install selenium （webdriver框架）
pip install PIL （圖片處理）
chrome driver：http://chromedriver.storage.googleapis.com/index.html
firefox driver：https://github.com/mozilla/geckodriver/releases

B站滑塊驗證碼

B站的滑塊驗證碼如上。

這類驗證碼可以使用 selenium 操作瀏覽器拖拽滑塊來進行破解，難點兩個，一個如何確定拖拽到的位置，另一個是避開人機識別（反爬蟲）。

確定滑塊驗證碼需要拖拽的位移距離

有三種方式

人工智慧機器學習，確定滑塊位置
通過完整圖片與缺失滑塊的圖片進行畫素對比，確定滑塊位置
邊緣檢測演算法，確定位置

各有優缺點。人工智慧機器學習，確定滑塊位置，需要進行訓練，比較麻煩，也可以看是否存在線上api可以呼叫。以下介紹其他兩種方式。

對比完整圖片與缺失滑塊的圖片

| 僅介紹，本文不進行實現。對於B站來說，是準確率最高的方式（100%），但不能保證未來B站的滑塊驗證升級，導致不可用。

B站的滑塊驗證模組，一共有三張圖片：

完整圖、缺失滑塊圖、滑塊圖，都是由畫布繪製出的。類似於：

完整圖：

完整圖

缺失滑塊圖：

缺失滑塊圖

滑塊圖：

HTML程式碼類似於：

<div class="geetest_canvas_img geetest_absolute" style="display: block;">
<div class="geetest_slicebg geetest_absolute">
	<canvas class="geetest_canvas_bg geetest_absolute" height="160" width="260"></canvas>
	<canvas class="geetest_canvas_slice geetest_absolute" width="260" height="160"></canvas>
</div>
<canvas class="geetest_canvas_fullbg geetest_fade geetest_absolute" height="160" width="260" style="display: none;"></canvas>
</div>

只需要通過selenium獲取畫布元素，執行js拿到畫布畫素，遍歷完整圖和缺失滑塊圖的畫素，一旦獲取到差異（需要允許少許畫素誤差），畫素矩陣x軸方向即是滑塊位置。
另外由於滑塊圖距離畫布座標原點有距離，還需要減去這部分距離。
最後使用 selenium 拖拽即可。

邊緣檢測演算法，確定位置

| 滑塊基本上是個方形，通過演算法確定方形起始位置即可。

計算位置

介紹兩種方式

滑塊是方形的，存在垂直的邊，該邊在缺失滑塊圖中基本都是灰黑的。遍歷畫素找到基本都是灰黑的邊即可。
缺失滑塊圖中滑塊位置是灰黑封閉的。通過演算法可以找到封閉區域，大小與滑塊相近，即是滑塊需要拖拽到的位置。

第二種實現起來有些複雜，不進行實現了。

下面是第一種實現方式，會存在檢測不出或錯誤的情況，使用時需要換一張驗證碼。也可能存在檢測出的邊是另一條（因為B站的滑塊不是長方形，存在弧形邊），那麼需要減去滑塊寬度

class VeriImageUtil():

 def __init__(self):
  self.defaultConfig = {
   "grayOffset": 20,"opaque": 1,"minVerticalLineCount": 30
  }
  self.config = copy.deepcopy(self.defaultConfig)

 def updateConfig(self,config):
  # temp = copy.deepcopy(config)
  for k in self.config:
   if k in config.keys():
    self.config[k] = config[k]

 def getMaxOffset(self,*args):
  # 計算偏移平均值最大的數
  av = sum(args) / len(args)

  maxOffset = 0
  for a in args:
   offset = abs(av - a)
   if offset > maxOffset:
    maxOffset = offset
  return maxOffset

 def isGrayPx(self,r,g,b):
  # 是否是灰度畫素點，允許波動offset
  return self.getMaxOffset(r,b) < self.config["grayOffset"]

 def isDarkStyle(self,b):
  # 灰暗風格
  return r < 128 and g < 128 and b < 128

 def isOpaque(self,px):
  # 不透明
  return px[3] >= 255 * self.config["opaque"]

 def getVerticalLineOffsetX(self,bgImage):
  # bgImage = Image.open("./image/bg.png")
  # bgImage.im.mode = 'RGBA'
  bgBytes = bgImage.load()

  x = 0
  while x < bgImage.size[0]:
   y = 0
   # 點》》線，灰度線條數量
   verticalLineCount = 0
   if x == 258:
    print(y)
   while y < bgImage.size[1]:
    px = bgBytes[x,y]
    r = px[0]
    g = px[1]
    b = px[2]
    # alph = px[3]
    # print(px)
    if self.isDarkStyle(r,b) and self.isGrayPx(r,b) and self.isOpaque(px):
     verticalLineCount += 1
    else:
     verticalLineCount = 0
     y += 1
     continue

    if verticalLineCount >= self.config["minVerticalLineCount"]:
     # 連續多個畫素都是灰度畫素，直線
     # print(x,y)
     return x

    y += 1

   x += 1
  pass


if __name__ == '__main__':
 bgImage = Image.open("./image/bg.png")
 veriImageUtil = VeriImageUtil()

 # veriImageUtil.updateConfig({
 #  "grayOffset": 20,#  "opaque": 0.6,#  "minVerticalLineCount": 10
 # })
  bgOffsetX = veriImageUtil.getVerticalLineOffsetX(bgImage)
 print("bgOffsetX:{} ".format(bgOffsetX))

總結

以上所述是小編給大家介紹的Python破解BiliBili滑塊驗證碼的思路詳解(完美避開人機識別)，希望對大家有所幫助！

Python破解BiliBili滑塊驗證碼的思路詳解(完美避開人機識別)

Python破解BiliBili滑塊驗證碼的思路詳解(完美避開人機識別)

Python破解BiliBili滑塊驗證碼，完美避開人機識別

Python模擬登入之滑塊驗證碼的破解(例項程式碼)

python滑塊驗證碼的破解實現

Python Selenium破解滑塊驗證碼最新版！

Python + selenium 破解極驗滑塊驗證碼模擬人類滑動行為（解決驗證碼被怪物吃掉的問題）

php+js實現的拖動滑塊驗證碼驗證表單操作示例【附原始碼下載】

javascript實現支付寶滑塊驗證碼效果

headless模式美團滑塊驗證碼無法通過的解決方案

新版無完整背景圖片滑塊驗證碼

滑塊驗證碼識別

一個有意思的滑塊驗證碼（原圖返回）

網站滑塊驗證碼分析：Crack Captcha

小小滑塊可笑可笑-安卓滑塊驗證碼通殺方案研究(1)

【原創】【滑塊驗證碼】

【asp.net】滑塊驗證碼（分享一個從github上下載的原始碼）

JavaScript實現滑塊驗證碼

Vue3+Vue-cli4專案中使用騰訊滑塊驗證碼

Vue3+Vue-cli4專案中使用騰訊滑塊驗證碼的方法

驗證碼之滑塊驗證碼

Python破解BiliBili滑塊驗證碼的思路詳解(完美避開人機識別)

相關推薦