python 獲取搜狗輸入法裡面所有的表情圖片

阿新 • • 發佈：2018-11-15

首先我們要使用fiddler爬取搜狗輸入法表情介面，開啟搜狗輸入法鍵盤，裡面有個表情，點選進去會進去搜狗的圖片表情，其中有個輸入框，我們要抓取的就是輸入對應的文字，找到搜狗所有的管理按圖片；比如我輸入的是
"哈士奇"，會出現
python 獲取搜狗輸入法裡面所有的表情圖片
其中的介面引數，我直接提供大家，大家可以按照這個介面格式進行獲取圖片

 http://config.pinyin.sogou.com/picface/interface/query_zb.php?cands=5ZOI5aOr5aWH&tp=0&page=1&h=D9BB9D40B88283286D79B44EB3849EBE&v=8.9.0.2180&r=0000_sogoupinyin_8.9c&pv=6.1.7601&sdk=1.1.0.1819
 其中只有引數 cands 以及 page 是變化的，cands是要搜尋的條件即我們輸入的"哈士奇"，page是獲取的頁數
 顯然輸入的中文進行了編碼，這就是 base64編碼，但是經過 python base64 編碼得到的是5ZOI5aOr5aWH，而
 我抓取介面引數是5zoi5AoR5Awh 。可能就是大小寫的原因，但是我替換我生成的5ZOI5aOr5aWH引數，介面
 沒有返回引數，反而5zoi5AoR5Awh 就返回了引數。。。。。

2.難點介紹

 1.cands 是base64 加密後的字串，但是需要使用 python裡面字串函式 swapcase()  ，這個函式的意思是
 字串內大寫字元轉化小寫，而小寫字母轉化大寫 ， 即搜狗介面引數需要在我們進行base64加密之後進行
     轉化，接口才可通
     2.解析圖片，一般搜狗返回的是 圖片url，比如 
     https://emoi-cncdn.bing.com/emotionimage/chat/b6be53fab273d5742de330b29e9f3a93.jpg,  這種我們自然
     可以獲取二進位制和圖片字尾， 但是搜狗也會返回
     http://i03picsos.sogoucdn.com/3057c3f30647ee17 ，這種有二進位制，但是不知道圖片字尾

3.程式碼解釋

     # -*- coding: UTF-8 -*-
     import base64
     import sys,requests,json,os,re

         #儲存圖片
    def save_img(content,path,name):
                    isExists=os.path.exists(path)
                    if not isExists:
                            os.makedirs(path) 
                    i_path = path+'\\'+name
                    with open(i_path,'ab') as f:    
                            f.write(content)     

                                    #獲取介面的json資料
    def sougou_face(keyword,page):
        #搜狗的base64 加密，得到字串需要轉化 ，接口才可以使用
        serach_word = base64.b64encode(keyword)
        serach_word = serach_word.swapcase()     # 實現 大寫轉化小寫，小寫轉化大寫
        url_send = 'http://config.pinyin.sogou.com/picface/interface/query_zb.php'
        params = 'tp=0&page='+str(page)+'&h=D9BB9D40B88283286D79B44EB3849EBE&v=8.9.0.2180&r=0000_sogoupinyin_8.9c&pv=6.1.7601&sdk=1.1.0.1819';
        url_send = url_send+'?cands='+serach_word+'&'+params
        head={"Content-Type":"application/json;charset=utf-8"}
        response = requests.get(url_send,headers=head)
        return response.content

        #解析圖片
    #http://i03picsos.sogoucdn.com/3057c3f30647ee17  可能存在這種圖片
    def list_img(sogou_data):
        json_data = json.loads(sogou_data)
        if(json_data['imglist']):
            for k in json_data['imglist']:
                img_id = k['id']   #圖片唯一標識
                img_type = k['url'][-3:]
                img_list = ['jpg','gif','png']
                #不帶字尾時候  可以直接賦值字尾
                if img_type not in img_list:
                    img_type = 'jpg'
                response = requests.get(k['url']).content
                path = 'D:\\python\\study\\splider\\mask\\img\\'+k['keywords']
                save_img(response,path,img_id+'.'+img_type) 
        else:
                print u'未找到圖片，停止程式' 
                exit()

   sogou_data = sougou_face('哈士奇',1)
    list_img(sogou_data)
    exit()

    #====================== 程式碼解釋 =====================

    1.sogou_data = sougou_face('哈士奇',1)  
    搜尋關鍵詞為哈士奇，即介面引數中的 cands，1 代表搜尋第一頁，其中函式返回的是二進位制
    2.list_img(sogou_data) 
    根據二進位制生成對應的圖片 ，在函式 list_img 裡面
             img_id = k['id']   #圖片唯一標識
                img_type = k['url'][-3:]
                img_list = ['jpg','gif','png']
                #不帶字尾時候  可以直接賦值字尾
                if img_type not in img_list:
                    img_type = 'jpg'
     就是上面所說的，返回如果沒有圖片字尾的話，我們自動給圖片字尾為jpg，儲存路徑可自動更改
     3.如果爬蟲的同學，可以修改程式碼裡面的 sougou_face('哈士奇',1)  ，即修改引數頁數，sougou_face('哈士奇',2)  
     sougou_face('哈士奇',3)   sougou_face('哈士奇',4)  ，迴圈即可自動抓去 ，本文只顯示手動抓取某一頁
     4.這是早上突發奇想完成的，程式碼肯定有需要改善的地方，希望各位提出，謝謝！！
     5.最後如果你在 本地除錯 ，cmd命令裡面直接傳引數
     cmd   python test.py 哈士奇 1    
     只需要新增  ，至於為什麼要編碼 ，就是cmd視窗預設是gbk編碼，我們接受的值需要轉化
     s_name = sys.argv[1].decode('gbk').encode('utf8')
    s_page = sys.argv[2]
    sogou_data = sougou_face(s_name,s_page)
    list_img(sogou_data)
    exit()

最後顯示部分成果
python 獲取搜狗輸入法裡面所有的表情圖片

python 獲取搜狗輸入法裡面所有的表情圖片

首先我們要使用fiddler爬取搜狗輸入法表情介面，開啟搜狗輸入法鍵盤，裡面有個表情，點選進去會進去搜狗的圖片表情，其中有個輸入框，我們要抓取的就是輸入對應的文字，找到搜狗所有的管理按圖片；比如我輸入的是"哈士奇"，會出現其中的介面引數，我直接提供大家，大家可以按照這個介面格式進行獲取圖片 ht

python爬搜狗微信獲取指定微信公眾號的文章

lac bubuko 驗證 user pre info 分享 ima sogo 前言：之前收藏了一個叫微信公眾號的文章爬取，裏面用到的模塊不錯。然而偏偏報錯= =。果斷自己寫了一個正文：第一步爬取搜狗微信搜到的公眾號： http://weixin.sogo

搜狗輸入法體驗評測

界面用戶分享內容一個所想體驗天氣選擇搜狗輸入法體驗評測 1.用戶界面截圖：首先，左上有一個導航欄，對搜索的信息分門別類，我並不常用，所以他也沒有占據明顯的位置，右上是天氣和地點等，聊勝於無，中間是醒目的搜索框，簡潔明了 2.記住用戶選擇截圖

Ubuntu mate安裝搜狗輸入法

install 添加修復 sougou hat via ppa 比較 conf 學習使用linux不過兩周時間，換了3份發行版，體驗了red hat和devian陣營的版本。因為是給舊筆記本電腦安裝，而且自己是新手，還是選用了Ubuntu陣營的操作系統。Kylin系統是中

[ubuntu16.04]安裝搜狗輸入法

1.0 image 文件 .so pinyin amd64 cnblogs 重啟搜狗 1，搜狗輸入法下載： http://pinyin.sogou.com/linux/ 下載文件：sogoupinyin_2.1.0.0086_amd64.deb 2，安裝方法：（1）直接

ubuntu安裝搜狗輸入法（ubuntu 14.04、ubuntu16.04通用）

ron 搜索 conf 技術 ubuntu安裝再次 ges key log 本方法ubuntu 14.04、ubuntu16.04通用。 1.下載搜狗輸入法的安裝包deb 下載地址： http://pinyin.sogou.com/linux/?r=pinyin 2.安裝

kali 2.0安裝搜狗輸入法簡易教程

kali 搜狗輸入法安裝kali，配置好安裝源，選擇阿裏鏡像源。（網上教程很多自行搜索）通過瀏覽器進入搜狗官網下載（linux版本，位數根據安裝kali位數定）將下載好的搜狗輸入法版本從下載文件夾路徑剪切到home目錄下（kali界面可操作性）在home目錄下看文件是否存在，然後執行apt-get -f i

對搜狗輸入法的評價

下載用戶界面增加好處 gpo bsp font post 界面從用戶界面、記住用戶選擇、短期刺激、長期使用的好處壞處、不要讓用戶犯簡單的錯誤四個方面對搜狗輸入法的評價。 · 搜狗輸入法用戶界面簡單明了大方，功能鮮明，並且可以更換皮膚，減少人們的疲倦感，增加新奇感。

在Ubuntu上安裝搜狗輸入法

登錄密碼問題輸入法語言 lin 右上角 linux版本選擇適合 1.進入搜狗輸入法官網 2.下載Linux版本，選擇64bit 下載 3.等待下載的同時，進行系統配置　　進入系統設置->語言支持->進行更新(需要輸入登錄密碼)->在鍵盤輸入法系

ubuntu下安裝搜狗輸入法

TP 技術分享 ins 新版 info 安裝系統設置 code pinyin 　　fcitx 被稱為小企鵝輸入法，是一個以 GPL 方式發布的輸入法平臺，可以通過安裝引擎支持多種輸入法。它的優點是，短小精悍、跟程序的兼容性比較好！打開系統設置語言支持將

ubuntu安裝搜狗輸入法

HR RR extern linux 安裝 Go sogo ubuntu安裝 href 鏈接主頁地址:搜狗輸入法 for linux ubuntu下安裝方法: 1. 去官網下載deb安裝包sudo apt-get install fcitx #安裝 fcitxsudo

CentOS 7 需要安裝的常用工具，及centos安裝fcitx 搜狗輸入法的坑旅

spl gnome2 cloud 進入 load rhel 美化任務 hit https://blog.csdn.net/tham_/article/details/41868831 Centos常用設置 1.當最大化時隱藏標題欄或者使用tweak to

linux下使用搜狗輸入法皮膚(.ssf)

發行版 linu 搜狗輸入法 windows .com 剛才打字自己能力你還在因為Windows下漂亮的輸入法皮膚無法在linux下使用而煩惱嗎? 那你看這個教程就鐵定沒錯了! 好吧某種程度上算是教程其實就是我今天早上折騰了倆小時的產物適用範圍本篇的適用範圍為

VMware12環境下Ubuntu kylin 14.04安裝搜狗輸入法

雲盤第一步登錄 bus 官網下載自己 AR 註意點擊註意：Ubuntu 14.04以上版本默認就有fcitx（搜狗輸入法），但是啟用不了，必須要重新安裝才可以。　　　也可以單擊系統設置裏面-->語言支持，使用 ibus 輸入法第一步：卸載fcitx輸入法

配置Ubuntu16.04第03步：安裝搜狗輸入法

image tro 系統設置 2.3 -a pin pda 沒有使用 1.進入搜狗官網：https://pinyin.sogou.com/linux/ ，下載搜狗輸入法安裝包 2.使用dpkg命令安裝Deb包： sudo dpkg -i sogoupinyin_2.

搜狗輸入法centos7

sta inux base als code img webkit repos com 1、管理員身份下進行 yum install alien -y 安裝alien依賴文件註：若提示一下錯誤，解決方法為： [root@localhost opt]# rm -f /va

centos 7安裝搜狗輸入法

pin 過程如果 entos ins 轉換 sogou n-2 yum 1.安裝alien依賴軟件 sudo yum install alien -y 2.安裝依賴軟件 sudo yum install qtwebkit -y 3.轉換rpm包 sudo alien -r

ubuntu成功安裝搜狗輸入法

選項中文 width enter table ins 測試圖片 pkg 在安裝之前，我們要先了解一個事實，那就是linux下安裝軟件和Windows是非常不同的，並不是簡單地雙擊安裝包就可以安裝了。linux很多軟件都有自己的一個依賴源，如果不先安裝好這些依賴源，你是無

Manjaro 系統添加國內源和安裝搜狗輸入法

-c 軟件 only pac all linu c-s config sogou 添加中科大源 #打開配置文件 sudo nano /etc/pacman.conf 在文件末尾添加 [archlinuxcn] SigLevel = Optional TrustedOn

Ubuntu 16.04解決WPS下搜狗輸入法不能輸入中文的問題

問題：WPS下搜狗輸入法不能輸入中文原因：環境變數未正確設定方法：—————————————————— （1）word部分 $ vi /usr/bin/wps 在第一行 #!/bin/bash 下新增： export XMODIFIERS="@im=fcitx

python 獲取搜狗輸入法裡面所有的表情圖片

相關推薦