1. 程式人生 > >爬蟲09-雙色球

爬蟲09-雙色球

import requests
import re

html = requests.get('http://zst.aicai.com/ssq/openInfo/').content.decode('utf-8', 'ignore')
pattern = re.compile('<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="blueColor sz12".*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>', re.S | re.M)
result = re.findall(pattern, html)
print(result)