互聯網之無所遁形！

阿新 • • 發佈：2017-08-21

人臉比較 python

其實一直對電影裏面的對犯人進行人臉匹配然後，刷出來犯人信息很感興趣，今天晚上一時興起，就搞了一把小的。

理論上：你可以建立一個你感興趣的百萬級的數據庫，給你個照片，你就可以得到她是誰，哪裏的，信息都可以知道，而且因為人與人之間的網狀的關聯，你甚至可以知道她喜歡的人是誰，男朋友長啥樣子。

想信我：一切都不是虛構的，你能做的更多！

思路：

一、數據收集，可以采用爬蟲對網上海裏的明星信息進行有針對的爬取

二、格式化數據，存入mysq，把明星的自拍照的文件名存入數據庫中

三、使用百度的api對程序進行編寫，說實話，百度人臉識別做的很棒了，精確度很高

四、你上傳一張圖片（或者你能想象到的方式），後面的程序會對你海量的數據庫中人的信息進行比對

五、輸出匹配到的人的信息，和相似度的數值。

直接上代碼：

# encoding:utf-8`
import base64
import urllib
import urllib2
import simplejson as json
from  os import listdir
import MySQLdb
import sys
reload(sys)
sys.setdefaultencoding(‘utf-8‘)

def conmysql():
    conn= MySQLdb.connect(
        host=‘localhost‘,
        port = 3306,
        user=‘root‘,
        passwd=‘123456‘,
        db =‘xxnlove‘,
    	charset=‘utf8‘
        )
    #cur = conn.cursor()
    return conn

‘‘‘
人臉比對接口
‘‘‘

def facecompar(image01,image02):
    matchUrl = "https://aip.baidubce.com/rest/2.0/face/v2/match"
    # 二進制方式打開圖文件
    f = open(image01, ‘rb‘)
    # 參數images：圖像base64編碼
    img1 = base64.b64encode(f.read())
    # 二進制方式打開圖文件
    f = open(image02, ‘rb‘)
    # 參數images：圖像base64編碼
    img2 = base64.b64encode(f.read())
    # 參數images：圖像base64編碼,多張圖片半角逗號分隔
    params = {
        "images": img1 + ‘,‘ + img2}
    params = urllib.urlencode(params)
    access_token = ‘24.1a060b87a0dfcab77317999d.25922220.1505832798.282335-10029360‘
    matchUrl = matchUrl + "?access_token=" + access_token
    request = urllib2.Request(url=matchUrl, data=params)
    request.add_header(‘Content-Type‘, ‘application/x-www-form-urlencoded‘)
    response = urllib2.urlopen(request)
    content = response.read()
    if content:
        content = json.loads(content)
        similar=content[‘result‘][0][‘score‘]
        return similar
        #if similar >80:
            #print "兩張圖片的相似度為"+str(similar)+"   很有可以能是同一個人"
        #    return similar
        #else:
        #    #print "兩張圖片的相似度為："+str(content[‘result‘][0][‘score‘])
        #    return similar
def compare():
    similarlist=[]
    similardict={}
    for img in listdir(‘./star/‘):
        similarvalue=facecompar(‘compar.jpg‘,‘./star/‘+img)
        similarlist.append(similarvalue)
        similardict[similarvalue]=img
    return similarlist,similardict

if __name__=="__main__":
    similarlist,similardict=compare()
    similarkey=sorted(similarlist)[-1]
    starname=similardict[similarkey] 
    conn = conmysql()
    cur = conn.cursor()
    sql="select * from face where iamge=‘%s‘" % starname
    cur.execute(sql)
    results = cur.fetchall() 
    print "一共對數據庫進行比對了"+str(len(similarlist))+"條信息"
    for info in results:
        print "匹配到明星的信息："+ info[0],info[1],info[2],"相似度："+str(similarkey)
    conn.close()

測試圖片：

技術分享

因為她是我高中的時候喜歡過的明星，所以~~~~

明星數據庫：

技術分享

因為只是先把路走通，所以數據很少。

明星的照片所在目錄：

技術分享

明星照片：

技術分享

程序運行效果：

技術分享

一共對數據庫進行比對了5條信息

匹配到明星的信息：曾軼可 27 1990年1月3日出生於湖南省常德市漢壽縣，創作型女歌手，演員。相似度：63.689125061

需要改進的：

01、數據量太少

02、程序太醜

本文出自 “付煒超” 博客，謝絕轉載！

互聯網之無所遁形！

人臉比較 python 其實一直對電影裏面的對犯人進行人臉匹配然後，刷出來犯人信息很感興趣，今天晚上一時興起，就搞了一把小的。理論上：你可以建立一個你感興趣的百萬級的數據庫，給你個照片，你就可以得到她是誰，哪裏的，信息都可以知道，而且因為人與人之間的網狀的關聯，你甚至可以知道她喜歡的人是誰，男朋友長啥樣子

小米估值爭議背後，缺失技術優勢的IoT如何撐起“互聯網之夢”？

小米前不久，小米在港交所遞交了招股書。對此，各方輿論與分析者的解讀中似乎充滿了爭議，一時間吵得好不熱鬧。而爭議的焦點就在於一句話：小米到底有多少估值？小米的現象級商業成功當然不容抹殺。但獨特的商業模式和市場軌跡，似乎也讓大眾和資本市場難以斷定小米到底是一家什麽樣的公司，未來會按照哪種模式發展，而估值爭議也就相

爬蟲有多好玩？所見即所爬！抓取網頁、圖片、文章！無所不爬！

一，首先看看Python是如何簡單的爬取網頁的 1，準備工作專案用的BeautifulSoup4和chardet模組屬於三方擴充套件包，如果沒有請自行pip安裝，我是用pycharm來做的安裝，下面簡單講下用pycharm安裝chardet和BeautifulSou

生產者消費者模型爬取某金融網站資料！Python無所不爬！

那麼這個模型和爬蟲有什麼關係呢？其實，爬蟲可以認為是一個生產者，它不斷從網站爬取資料，爬取到的資料就是食物；而所得資料需要消費者進行資料清洗，把有用的資料吸收掉，把無用的資料丟棄。以上便是對生產者消費者模型的簡單介紹了，下面針對本次爬取任務予以詳細說明。分析站點http://www.cfachina.org/

程序員成功秘密：從6個互聯網大佬參悟人生！

多說管理員員工福利分享圖片工資互聯網企業文化人的澳大利亞我剛畢業，如何入行計算機網絡這一行業？幹了幾年網絡了，感覺進入瓶頸期，不知道下一步該怎麽走了？大家做生意的做生意，轉管理的也不在少數，我還需要堅持做技術麽？問題雖然五花八門，但是總結下來就是一個

Java 14 來勢洶洶，這回讓空指標無處遁形！！

上篇：Java 14 之模式匹配，非常讚的一個新特性！相信在坐的每一位 Java 程式設計師都遇到過空指標異常： NullPointerException（NPE），不甚其煩。棧長之前也分享幾篇避免空指標的文章：別再寫 bug 了，避免空指標的 5 個案例！沒用 Java 8，怎麼優雅地避免空指標？

dubbo+zookeeper+springmvc+mybatis+shiro+redis分布式大型互聯網企業架構！

分布式、微服務、雲架構 dubbo+zookeeper springmvc+mybatis shiro+redis java分布式大型互聯網企業架構 spring 平臺簡介 Jeesz是一個分布式的框架，提供項目模塊化、服務化、熱插拔的思想，高度封裝安全性的Java EE

精華【分布式、微服務、雲架構、dubbo+zookeeper+springmvc+mybatis+shiro+redis】分布式大型互聯網企業架構！

net ios 系統數據庫權限分配容器移動 activit str 重復平臺簡介 Jeesz是一個分布式的框架，提供項目模塊化、服務化、熱插拔的思想，高度封裝安全性的Java EE快速開發平臺。 Jeesz本身集成Dubbo服務管控、

精華分布式、微服務、雲架構dubbo+zookeeper+springmvc+mybatis+shiro+redis分布式大型互聯網企業架構！

分布式、微服務、雲架構 spring springmvc dubbo+zookeeper spring mvc+mybatis redis分布式緩存平臺簡介 Jeesz是一個分布式的框架，提供項目模塊化、服務化、熱插拔的思想，高度封裝安全性的Java EE快速開發平臺。

精華【分布式、微服務、雲架構、dubbo+zookeeper+springmvc+mybatis+shiro+redis分布式大型互聯網企業架構！

平臺簡介 Jeesz是一個分布式的框架，提供項目模塊化、服務化、熱插拔的思想，高度封裝安全性的Java EE快速開發平臺。 Jeesz本身集成Dubbo服務管控、Zookeeper註冊中心、Redis分布式緩存技術、FastDFS分布式文件系統、A

分布式架構真正適用於大型互聯網項目的架構！ dubbo+zookeeper+springmvc+mybatis

spring mvc+my batis kafka dubbo+zookeerper restful redis分布式緩存平臺簡介 Jeesz是一個分布式的框架，提供項目模塊化、服務化、熱插拔的思想，高度封裝安全性的Java EE快速開發平臺。 Jeesz本身集成

厲害了Word杭州互聯網法院！網上提交訴狀5分鐘搞定

nbsp 全國效率方案 2016年規則處理轉換視頻你以為打官司只能驅車趕路去現場？你已經OUT了　你以為互聯網只能瀏覽購物打遊戲？你又OUT了　　“互聯網＋法庭”讓你體驗不一樣的“網絡打官司”新常態　　喲喲~~我已看見你滿臉質疑的小表情啦　　真不是小

奇點臨近：互聯網經濟的供給側革命和全球貨幣政策的新格林斯潘之謎

new 投資 -s lin 流程質變配置 family 效應 “宏觀七日談”欄目是華爾街見聞和天風宏觀研究團隊聯手打造的宏觀深度分析一、互聯網經濟的供給側革命從上世紀70年代開始，人類實際上經歷了兩次技術革命：計算機革命和互聯網革命。計算機廣泛提高了人的生產效率和工資增

互聯網級監控系統必備-時序數據庫之Influxdb技術

範圍算術變化 tag time int curl index 服務時間序列數據庫，簡稱時序數據庫，Time Series Database，一個全新的領域，最大的特點就是每個條數據都帶有Time列。時序數據庫到底能用到什麽業務場景，答案是：監控系統。 Baidu

BAT解密：互聯網技術發展之路（8）- 用戶層技術剖析

用戶管理相同開源大廠 cookie alt 之間平臺之路互聯網業務用戶層技術主要包括：用戶管理、消息推送、存儲雲、圖片雲。用戶管理互聯網業務的一個典型特征就是通過互聯網將眾多分散的用戶連接起來。因此用戶管理是互聯網業務不可缺少的一部分。略微大一點的互聯網業務

精華【分布式微服務雲架構dubbo+zookeeper+springmvc+mybatis+shiro+redis】分布式大型互聯網企業架構！

數據字典 https sql log redmine websphere 搜索 pri 數據庫表摘要: 開發工具 1.Eclipse IDE：采用Maven項目管理，模塊化。 2.代碼生成：通過界面方式簡單配置，自動生成相應代碼，目前包括三種生成方式（增刪改查）：單表、

傳統行業如何通過微信擁抱互聯網！

互聯網互聯網這個概念已經越來越廣泛傳播開來，傳統行業怎麽樣擁抱互聯網，利用互聯網煥發新的活力，微信將是一個不錯的選擇。傳統行業，說到傳統行業大家能想到都是哪些？汽車站？停車場？醫院？餐廳？這些是不是都是傳統行業呢？傳統行業怎麽轉型互聯網，首先要從思維方式來討論這個問題。傳統行業轉型是互聯網+，還是+互聯網，很

十大互聯網數據分析方法之-漏鬥分析

.com 時間細節 quora 之間因此設置常數過多一、如何將轉化率提升10倍？Danny·Jon,是一名數據分析師，曾效力於 Facebook、Twitter、Quora。在他的增長黑客生涯中，曾遇到這樣一個難題：來自搜索引擎的流量占到網站流量的60%，但其中

十大互聯網數據分析方法之—細分分析

sha col 沒有客戶其余針對需要互聯 href 一、原理“細分是一切分析的本源！不細分無分析！” 這是我們學習細分分析時常見的一句話，對細分分析冠於如此高的評價，不只是因為它在分析方法上的強大，更重要的是在當前流量紅利逐步消逝的時代，籠統的網站統計和網站分析已

互聯網之無所遁形！

相關推薦