爬蟲高階應用03---資料庫和Json獲取

阿新 • • 發佈：2018-12-17

爬蟲基礎day03—資料庫和動態獲取

一.和MySQL資料庫建立連線

import pymysql

def main():
    # 設定連線
    db = pymysql.connect(
        host='localhost',
        port=3306,
        user='root',
        password='123456',
        db='spider',
        charset='utf8')
    # 遊標
    cursor = db.cursor()
    # 寫sql語句
    sql = "INSERT INTO beautiful(url,content)VALUES('123','測試')",
    # 解析sql語句
    cursor.execute(sql)
    # 提交
    db.commit()

if __name__ == '__main__':
    main()

注意：插入資料防止重複插入可用唯一索引

格式：alter table 表 add unique(欄位)
示例：alter table money add primary key(id);
解釋：為money表的id欄位增加主鍵索引

二、動態獲取（以蘑菇街為例）

import requests
from lxml import etree
import json


# 取頁面HTML
def get_one_page():
	url = 'https://list.mogujie.com/search?callback=jQuery21104432147899441732_1540347837433&_version=8193&ratio=3%3A4&cKey=15&page=1&sort=pop&ad=0&fcid=50206&action=trousers&acm=3.mce.1_10_1hepw.109731.0.ubj8Qr7mesgMd.pos_1-m_406086-sd_119-mf_15261_1047900-idx_0-mfs_4-dm1_5000&ptp=1._mf1_1239_15261.0.0.wdmwVEI3&_=1540347837434'
	headers =  {
		"User-Agent": "Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; 360SE)"
	}
	response = requests.get(url, headers=headers)
	if response.status_code == 200:
		text = response.content.decode('utf-8')
		return text
	return None


def get_real_content(html):
	if html and len(html) > 128:
		html1 = html.split('(')[1:][0]
		html1 = html1.replace(');', '')
		return html1
	return None



def main():
	html = get_one_page()
	html_content = get_real_content(html)
	print(html_content)
	result = json.loads(html_content)
	print(result['status']['code'])

if __name__ == '__main__':
	main()

爬蟲高階應用03---資料庫和Json獲取

爬蟲基礎day03—資料庫和動態獲取一.和MySQL資料庫建立連線 import pymysql def main(): # 設定連線 db = pymysql.connect( host='localhost',

Flask高階應用03---cookie和session

前言 Session和Cookie的結合使用，一般有兩種儲存方式: 第一種: session資料儲存在客戶端: Flask採用’secure cookie’方式儲存session，即session資料是使用base64編碼後儲存在客戶端的cookie中。也就是說無須依賴第三方資料庫儲

Flask高階應用02--請求和反向解析

一、請求和響應 1. 請求request 服務端在接收到客戶端的請求後，會自動建立Request物件，由Flask框架建立，Request物件不可修改 @blue.route('/request/',methods=['GET','POST','PUT']) def get_re

Flask高階應用05---模型和資料遷移

新建專案做好基礎配置一、Flask模型簡介 Flask預設並沒有提供任何資料庫操作的API 我們可以選擇任何適合自己專案的資料庫來使用 Flask中可以自己的選擇資料，用原生語句實現功能，也可以選擇ORM（SQLAlchemy，MongoEngine） SQLAlche

Flask高階應用04---jinja2和模板使用

一.模板引擎— jinja2 Flask中使用jinja2模板引擎 jinja2是由Flask作者開發，模仿Django的模板引擎優點：速度快，被廣泛使用 HTML設計和後端python分離非常靈活，快速和安全提供了控制，繼承等高階功能二、模板語法（挖

Selenium 高階應用之WebDriverWait 和 expected_conditions

　Seleniium 是相當不錯的一個第三方測試框架，可惜目前國內已經無法訪問其官網（FQ可以）。不知道大家是否有認真檢視過selenium 的api，我是有認真學習過的。selenium 的api中包含有WebDriverWait 和 expected

【雲星資料---Apache Flink實戰系列(精品版)】：Apache Flink高階特性與高階應用008-Slot和Parallelism的深入分析003

四、任務槽（task-slot）和槽共享（Slot Sharing） 1.任務槽（Task slot） 1.flink的TM就是執行在不同節點上的JVM程序（process）,這個程序會

【雲星資料---Apache Flink實戰系列(精品版)】：Apache Flink高階特性與高階應用006-Slot和Parallelism的深入分析001

一、flink架構 1.flink是一個主從結構的分散式程式，它由client和cluster兩部分組成。 2.cluster由主節點JobManager（JM）和從節點TaskManager組

python批量下載色影無忌和蜂鳥的圖片爬蟲小應用

exce pen 應用 content 沒有 str1 .com pat tar 有些冗余信息。由於之前測試正則表達式。所以沒有把它們給移走。只是不影響使用。# -*- coding:utf-8 -*- import re,urllib,sys,os,time de

06： awk基本用法 awk高階應用總結和答疑

Top NSD SHELL DAY06 案例1：使用awk提取文字案例2：awk處理條件案例3：awk綜合指令碼應用案例4：awk流程控制案例5：awk擴充套件應用 1 案例1：使用awk提取文字 1.1 問題本案例要求使用awk

sed基本用法 sed文字塊處理、 sed高階應用總結和答疑

Top NSD SHELL DAY05 案例1：sed基本用法案例2：使用sed修改系統配置案例3：sed多行文字處理案例4：sed綜合指令碼應用 1 案例1：sed基本用法 1.1 問題本案例要求熟悉sed命令的p、d、s等常見操作，並

C語言高階篇 - 1.C語言複雜表示式和指標高階應用

1.指標陣列與陣列指標 1.1、字面意思來理解指標陣列與陣列指標 (1)指標陣列的實質是一個數組，這個陣列中儲存的內容全部是指標變數。 (2)陣列指標的實質是一個指標，這個指標指向的是一個數組。 1.2、分析指標陣列與陣列指標的表示式 (1)int *

HBULIDER怎麼和後臺資料庫進行連結獲取資料

首先我是用myecilpse來和hubilder進行跨域相連的， 1、需要在myeclipse裡面搭建一個自己的過濾器，程式碼如下： //過濾器 public class crossDomainFilter implements Filter{ &nbs

Flask高階應用01--環境搭建和例項化藍圖

一、Flask簡介 Flask是一個基於Python實現的web開發的’微’框架，Flask和Django一樣，也是一個基於MVC設計模式的Web框架 [中文文件地址]http://docs.jinkan.org/docs/flask/ http://www.pythondoc.co

Flask高階應用06---模型的CRUD和高階用法

一、資料對映（資料庫crud基礎操作）注意:在遷移前首先要開啟資料庫mysql 1.建立模型==create_all（）對建立的模型資料進行遷移，這個方法只能用於首次建立，後面遷移需要用migrate（不建議用），建議用sql語句，orm實現的資料庫遷移不是最有方式 @b

奇葩思路獲取各大視訊平臺收費資源，思維決定python爬蟲的應用高度！

說起利用Python可以隨意抓取收費資源就很激動，然而這確實是事實。個人威信：1613161916 原創文章，未得同意切勿轉載！ 20行程式碼即可爬取所有網頁的收費視訊，而且這種方法基本很少有人想得到。那麼我先給大家講一下思路，對於Python掌握的不錯的朋友根據我的思路

B-樹和B+樹的應用資料搜尋和資料庫索引

分享一下我老師大神的人工智慧教程！零基礎，通俗易懂！http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識，造福人民，實現我們中華民族偉大復興！

【TestNG】testNG傳參的用法和高階應用

一.TestNG用法說明 TestNG的詳細教程請看連結：https://blog.csdn.net/df0128/article/details/83243822 二.直接從類中傳參此處需要用到註解@DataProvider來進行傳參，如下定義了一個測試用例，名為TestN

將web應用和mysql都部署到linux下，web應用通過jdbc就無法獲取到mysql連線。

org.springframework.web.util.NestedServletException: Request processing failed; nested exception is org.mybatis.spring.MyBatisSystemException: nested

03.Fabric應用開發流程和Fabric業務網路

陳述主要講Fabric應用開發流程和Fabric業務網路。 Fabric 應用開發流程 Fabric 業務網路業務網路，也叫共識網路或區塊鏈網路，由不同的節點構成。節點是區塊鏈的通訊實體，節點是一個邏輯概念，不同型別的節點可以執行在同一臺物理伺服器上。這些節點可

爬蟲高階應用03---資料庫和Json獲取

爬蟲基礎day03—資料庫和動態獲取

一.和MySQL資料庫建立連線

二、動態獲取（以蘑菇街為例）

相關推薦