爬蟲09-雙色球
阿新 • • 發佈:2018-11-01
import requests import re html = requests.get('http://zst.aicai.com/ssq/openInfo/').content.decode('utf-8', 'ignore') pattern = re.compile('<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?class="blueColor sz12".*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?class="redColor sz12".*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>.*?<td.*?>(.*?)</td>', re.S | re.M) result = re.findall(pattern, html) print(result)