python sdk 獲取新浪微博簽到資訊

阿新 • • 發佈：2019-01-31

不得不說廖大神這個sdk 在我這個新手看來寫的真是太完美了,介面呼叫寫成動態,封裝授權,返回jsondict

處理起來實在是方便

# -*- coding: utf-8 -*-

'''
Created on 2016年12月18日

@author: bitwater

基於python2.7
寫了一個類用來獲取poiidlist,
由於sina api的限制,也沒必要多執行緒了,除非.....
我建立了很多帳號,一旦有帳號被limit ,我就捕獲這個異常並重新授權 ( while(1) ) 
api介面穩定行不是很好(可能是因為app_key為認證), 為了防止不可預料的錯誤,當資料量非常大的時候
我儘量每次跑n條後 過幾分鐘再跑 ,參考下面的網站 ,官方說的很不明確限制到底是什麼
http://open.weibo.com/wiki/%E6%8E%A5%E5%8F%A3%E8%AE%BF%E9%97%AE%E9%A2%91%E6%AC%A1%E6%9D%83%E9%99%90

經過反覆測試,post或get可以達到連續萬次請求(應該是極限了),不過這個不穩定

我寫了一個類用來獲取所有的poiid
然後又寫了一個根據poiid list ,獲取使用者資訊的類


'''
import weibo
import codecs
from SinaSDK.PoiidList import PoiidList
import urllib2

class Sina(object):
        
    APP_KEY = [ 
               
               '4051276836',
               '1859650768',
               '1042452822',
               '3221056763',
               '367472040',
               '2880955737',
               '774292992',
               '1611999631'
               ]
    APP_SECRET = [
                  
                  '59f42a032177e22cfb738067fd481855',
                  'ceb63e1afc177ad21d06e22317fa88c9',
                  '4acf19662aff8a9dd1f5e2941d1975c1',
                  '5a2d00b6face2762d92de04ee1e8d799',
                  '0a7a707442089290b6fdaff9842f2786',
                  '08811a2e2f6e0c2ae8ce8b63676b84a5',
                  '01ecee0a13785b5e0b394b60c0acebc6',
                  '72c202d5bc094ef57210909ecc290c66'
                  ]
    CALL_BACK = 'https://api.weibo.com/oauth2/default.html'
    
    isUsed = 2
    
    def __init__(self):
        
        # app 
        self.app_key = Sina.APP_KEY[Sina.isUsed]
        self.app_secert = Sina.APP_SECRET[Sina.isUsed]
        self.call_back = Sina.CALL_BACK
        
        Sina.isUsed = Sina.isUsed + 1
        if Sina.isUsed >= len(Sina.APP_KEY):
            Sina.isUsed = 0
            
        # client 
        self.client = ""
        
        
        self.weidu = ''
        self.jingdu = ''
        
        self.poiiddict = {}
        self.poiidCnt = 0
        
    def startAPIClient(self):
        self.client = weibo.APIClient(self.app_key, self.app_secert, self.call_back)
        # 獲取該應用（APP_KEY是唯一的）提供給使用者進行授權的url
        auth_url = self.client.get_authorize_url()
        # 打印出使用者進行授權的url，將該url拷貝到瀏覽器中，伺服器將會返回一個url，該url中包含一個code欄位（如圖1所示）
        print auth_url
        # 輸入該code值（如圖2所示）
        code = raw_input("input the retured code : ")
        # 通過該code獲取access_token，r是返回的授權結果，具體引數參考官方文件：
        # http://open.weibo.com/wiki/Oauth2/access_token
        r = self.client.request_access_token(code)
            # 將access_token和expire_in設定到client物件
        self.client.set_access_token(r.access_token, r.expires_in)
        return self.client
             
        
    def start(self, weidu , jingdu):
        self.weidu = weidu
        self.jingdu = jingdu
        
        poilst = PoiidList(self.client , self.weidu , self.jingdu)
        
        self.poiiddict , self.poiidCnt = poilst.getPoiid()
        
        userinfo = UsersInfo(self.poiiddict , self.client)
           
        userinfo.getinfo()
          
        
    def printINFO (self):
        print self.weidu
        print self.jingdu
        print self.poiidCnt
        
        
class UsersInfo(object):
    '''
    classdocs
    '''

    def __init__(self, poiiddict, Client):
        '''
        Constructor
        '''
        self.poiiddict = poiiddict
        self.client = Client
        
    def getinfo(self):
        
        for Poiid in self.poiiddict.keys():
            
            while True : 
                try :
                    tmp = self.client.place.pois.users.get(poiid=Poiid, count=50, page=1)
                    break
                except weibo.APIError : 
                    sn = Sina()
                    self.client = sn.startAPIClient()
                except urllib2.HTTPError:
                    pass
                 
            # # 計算這個poiid 的總人數
            try:
                poiid_User_cnt = tmp['total_number']
            
            except TypeError:
                continue
            
            filename = self.poiiddict[Poiid]
            print u"一共有%d個人在%s簽到" % (poiid_User_cnt, filename)
            
            # # 計算總頁數
            Cnt = poiid_User_cnt // 50
            
            if poiid_User_cnt % 50 != 0 :
                Cnt = Cnt + 1
            # # 建立檔案並輸出
            fw = codecs.open("/home/bitwater/workSpace/eclipseSpace/sinaCraw/SinaSDK/sina/" + filename + ".csv", "w", "utf-8",)
            
            fw.write(u"有%d個" % (poiid_User_cnt))
            
            fw.write(u"使用者名稱,使用者id,出發地, 性別,簽到時間\n")
            # # 獲取每一頁
            for i in range(1, Cnt + 1):
                print "第%d頁" % (i)
                
                while True : 
                    
                    try :
                        everinfo = self.client.place.pois.users.get(poiid=Poiid, count=50, page=i)
                        break
                    except weibo.APIError : 
                        sn = Sina()
                        self.client = sn.startAPIClient()
                    except urllib2.HTTPError:
                        pass 
#                         everinfo = self.client.place.pois.users.get(poiid=Poiid, count=50, page=i)
                    
                for user in everinfo['users']:
                    fw.write(user['name'] + " ,")
                    fw.write(str(user['id']))
                    fw.write(" ,")
                    fw.write(user['location'] + " ,")
                    fw.write(user['gender'] + " ,")
                    fw.write(user['checkin_at'] + '\n')
            fw.close()
        
if __name__ == '__main__':

    
    weidu = "+29.13"
    jingdu = "+110.47"
#     weidu = raw_input(u"輸入維度")
#     jingdu = raw_input(u"輸入經度")
    
    sina = Sina()
    sina.startAPIClient()
    
    sina.start(weidu, jingdu)

# -*- coding: utf-8 -*-

'''
Created on 2016年12月19日

@author: bitwater
'''
import weibo
import codecs
from pyasn1.compat.octets import null


class PoiidList(object):
    '''
    get poiid 
    '''
    def __init__(self, Client, weidu, jingdu):
        '''
        Constructor
        '''
        self.client = Client
        self.poiiddict = {}
        self.weidu = weidu
        self.jingdu = jingdu
        self.poiid_cnt = 0
        
        self.listlimit = 50
    def getPoiid(self):
        tmp = self.client.place.nearby.pois.get(lat=self.weidu , long=self.jingdu , count=50 , range=10000, sort=3)

        self.poiid_cnt = tmp['total_number'] 
        print "該位置一共有%d個Poiid" % (self.poiid_cnt) 
        
        st = 1 
        cnt = self.poiid_cnt // self.listlimit 
        print "%d" % (cnt)
        
        
        
        
        """
        ceshi
        """
#         st = 5
#         cnt = st + 4 
        
        
        fw = codecs.open("/home/bitwater/workSpace/eclipseSpace/sinaCraw/SinaSDK/sina/PoiidList.txt", "w", "utf-8")
        for i in range(st, cnt):
            try:
                print "%d" % (i)
                tmp = self.client.place.nearby.pois.get(lat=self.weidu , long=self.jingdu , count=self.listlimit , range=10000, sort=3, page=i)
                if tmp is null:
                    break 
                al = tmp['pois']
                # 輸出 Poiid 跟對應的 名稱 
                for one in al:
                    print one['poiid'] , one['title']
                    fw.write(one['poiid'])
                    fw.write("  ")
                    fw.write(one['title'])
                    fw.write('\n')
                    self.poiiddict[one['poiid']] = one['title']
            except TypeError: 
                continue
        
        fw.close()       
        return self.poiiddict , self.poiid_cnt

python sdk 獲取新浪微博簽到資訊

不得不說廖大神這個sdk 在我這個新手看來寫的真是太完美了,介面呼叫寫成動態,封裝授權,返回jsondict 處理起來實在是方便 # -*- coding: utf-8 -*- ''' Created on 2016年12月18日 @author: bitwater

Python 獲取新浪微博的熱門話題 (API)

Code: #!/usr/bin/python # -*- coding: utf-8 -*- ''' Created on 2014-06-27 @author: guaguastd @name: sinaWeiboHotTrend.py ''' import j

Python 獲取新浪微博的最新公共微博

Code: #!/usr/bin/python # -*- coding: utf-8 -*- ''' Created on 2014-7-3 @author: guaguastd @name: statusesPublicTimeline.py ''' if __n

用python爬取新浪微博資料（無需手動獲取cookie)

從java 轉為python from selenium import webdriver import selenium from selenium.webdriver.common.desired_capabilities import DesiredCapabi

Python爬取新浪微博用戶信息及內容

pro 目標 oss 來源但是 blog .com 交流 exc 新浪微博作為新時代火爆的新媒體社交平臺，擁有許多用戶行為及商戶數據，因此需要研究人員都想要得到新浪微博數據，But新浪微博數據量極大，獲取的最好方法無疑就是使用Python爬蟲來得到。網上有一些關於使用Py

怎樣快速獲取新浪微博熱搜榜排名資料？

本文主要介紹“新浪微博搜尋熱搜榜API”的呼叫方法，以及呼叫前的準備工作和呼叫過程中可能出現的問題。新浪微博作為一款當前最主流的資訊傳遞和交流工具，在人們日常生活中佔據著非常重要的作用，對熱搜榜資料的採集可以方便檢視時下最熱門的事件關鍵字。接下來，給你詳細介紹“新浪微博搜尋熱搜榜API

python模擬登入新浪微博自動獲得呼叫新浪api所需的code

其中client_id是我們的APP_KEY；redirect_url是我們的回撥頁面，就是我們一開始建立應用時設定的；regCallback具體我不知道是哪來的，但是其中有兩個變數，一個是APP_KEY，一個就是我們設定的回撥頁面；其它的表單內容都是固定的。請求程式碼如下：fields={ 'act

Python程式碼登入新浪微博並自動發微博

前言對於很少玩微博@張行之_的我來說，微博內容少的可憐。所以本人就想：能不能寫個成功程式來幫我發微博。這個程式要滿足以下要求：自動化，自動登入微博，自動發微博。微博內容要有意義，不能是隨機生成的字元。可以設定每隔一段時間發一條微博，頻率不能太快，當

【python 新浪微博爬蟲】python 爬取新浪微博24小時熱門話題top500

一、需求分析模擬登陸新浪微博,爬取新浪微博的熱門話題版塊的24小時內的前TOP500的話題名稱、該話題的閱讀數、討論數、粉絲數、話題主持人，以及對應話題主持人的關注數、粉絲數和微博數。二、開發語言 python2.7 三、需要匯入模組 import

Python3獲取新浪微博內容亂碼問題

錯誤亂碼問題 sof lease enc 程序忽略打印 acc 用python獲取新浪微博最近發布內容的時候調用 public_timeline()函數的返回值是個jsonDict對象，首先需要將該對象通過json.dumps函數轉換成字符串，然後對該字符串用GBK進

python抓取新浪微博評論並分析

1，實現效果 2，資料庫 3，主要步驟 1，輸入賬號密碼，模擬新浪微博登陸 2，抓取評論頁的內容 3，用正則表示式過濾出使用者名稱，評論時間和評論內容 4，將得到的內容存入資料庫 5，用SQL語句實現其他功能：例如統計評論次數等 4，詳細步驟 # -*- codi

如何利用新浪微博開放平臺API獲取新浪微博使用者資料

首先登陸新浪微博開放平臺http://open.weibo.com/，然後要註冊成為開發者並且建立一個自己的應用，如下圖所示，應用已經建立完成。之後按照步驟首先要下載所需要的資源，點選新浪微博開放平臺的“文件”字樣，如下圖所示然後點選左側的“資源

基於scrapy的分散式爬蟲抓取新浪微博個人資訊和微博內容存入MySQL

為了學習機器學習深度學習和文字挖掘方面的知識，需要獲取一定的資料，新浪微博的大量資料可以作為此次研究歷程的物件一、環境準備 python 2.7 scrapy框架的部署（可以檢視上一篇部落格的簡要操作，傳送門：點選開啟連結） mysql的部署（需要的資源

關於新浪微博API python SDK

搞了好幾天，今天晚上終於弄出了點眉目，前幾天一直卡在了oauth 模組上，因為是第一次寫web應用，第一次接觸oauth ，還有什麼驗證什麼的，還有就是看見新浪的文件，一直被它誤導，頭都大了一圈，一直在找資料，找例程，今天終於算是有點進展，用API發了條訊息，接收了幾

python模擬新浪微博登陸之獲取cookies

首先感謝敲程式碼的耗子，之前一直搞不懂登陸新浪微博的原理，看了他那篇文章之後，終於明白了基本原理。在這裡主要是通過程式碼實現那篇文章的過程。獲取網頁使用的包是requests，正則匹配用的是re，其他需要的還有base64、rsa、binascii。如果安裝

python 爬蟲1 開始，先拿新浪微博開始

大括號版本 install esp con data- 定位 ble Language 剛剛開始學。目的地是兩個。一個微博，一個貼吧存入的話，臨時還沒想那麽多。先存到本地目錄吧分詞和推薦後面在整合 mysql mongodb hadoop redius 後面在用

iOS之接入新浪微博 SDK（微信支付）的坑(registerApp 的問題)

com .net symbols object type lan creat manager -o 最近在做一個 iOS 的 cocos2d-x 項目接入新浪微博 SDK 的時候被“坑”了，最後終於順利的解決了。發現網上也有不少人遇到一樣的問題，但是能找到的數量有限的解決辦

Python爬蟲開源項目代碼，爬取微信、淘寶、豆瓣、知乎、新浪微博、QQ、去哪網等代碼整理

http server 以及 pro 模擬登錄取數存在漏洞搜狗作者：SFLYQ 今天為大家整理了32個Python爬蟲項目。整理的原因是，爬蟲入門簡單快速，也非常適合新入門的小夥伴培養信心。所有鏈接指向GitHub，祝大家玩的愉快~ 1、WechatSogou

android 微博sdk 整合檔案不存在(8998) 您所訪問的站點在新浪微博的認證失敗，錯誤碼 21322

問題：使用mSsoHandler.authorize(new AuthListener()); 請求授權微部落格戶端報檔案不存在(8998) 使用mSsoHandler.authorizeWeb(new Au

如何使用新浪微博sdk

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

python sdk 獲取新浪微博簽到資訊

相關推薦