資料儲存(無資料庫版)之一：儲存為JSON

阿新 • • 發佈：2019-01-24

#coding:utf8
#使用Requests訪問http://seputu.com/，獲取並列印HTML文件內容
import requests
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'
headers = {'User-Agent':user_agent}
r = requests.get('http://seputu.com/', headers=headers)
print r.text

#分析網頁的HTML結構：
#標題和章節都被包含在<div class="mulu">標記下，標記位於其中的<div class="mulu-title">下的<h2>中，
 
#章節位於其中的<div class="box">下的<a>中
from bs4 import BeautifulSoup
soup = BeautifulSoup(r.text,'html.parser',from_encoding='utf-8')
for mulu in soup.find_all(class_="mulu"):
    h2 = mulu.find('h2')
    if h2 != None:
        h2_title = h2.string #獲取標題
for a in mulu.find(class_='box').find_all('a' 
) : #獲取所有的a標記中url和章節內容
href = a.get('href')
            box_title = a.get('title')
            print href,box_title


#此時已經成功獲取標題，章節；接下介紹python操作JSON檔案
#python通過JSON模組實現對JSON的編碼解碼操作；
#編碼：
# 把python物件轉換成JSON物件的過程，常用的兩個函式 dumps 和 dump；
# dump 是把python物件轉換成JSON物件，並將JSON物件通過fp檔案流寫入檔案；
# dumps 生成一個字串
#dumps(obj, skipkeys=False, ensure_ascii=True, check_circular=True,
 
#      allow_nan=True, cls=None, indent=None, separators=None,
#      encoding='utf-8', default=None, sort_key=False, **kw)
#dump(obj, fp, skipkeys=False, ensure_ascii=True, check_circular=True,
#      allow_nan=True, cls=None, indent=None, separators=None,
#      encoding='utf-8', default=None, sort_key=False, **kw)
#引數分析：
#Skipkeys:預設值為False。如果dict的keys內部的資料不是python的資料型別(str,
#         unicode,int,long,float,bool,None)，設定為False時,就會報TypeError錯誤。
#         設定為True時，則會跳過這類key;
#ensure_ascii:預設值True。如果dict內含有非ASCII的字串，則會以類似"\uXXXX"
#             的格式顯示資料，設定成False後，就能正常顯示；
#indent:是一個非負的整形，如果是0或者為空，則顯示資料，否則會換行且按照indent的
#       數量顯示前面的空白，將JSON內容進行格式化顯示；
#separators：分隔符，實際上是(item_separator,dict_separator)的一個元祖，預設的就是(',',':')，這表示
#          dictionary內keys之間用","隔開，key和value之間用":"隔開；
#encoding:預設是UTF-8。設定JSON資料的編碼方式；
#sort_keys:將資料根據keys的值進行排序；
import json
str = [{"username":"七夜","age":24},(2,3),1]
json_str = json.dumps(str,ensure_ascii=False)
print json_str
with open('qiye.text','w') as fp: #寫入檔案
json.dump(str,fp=fp,ensure_ascii=False)

#解碼：
#把json物件轉成python物件的過程，常用的兩個函式是 load和loads 函式，區別於dump與dumps一樣；
#loads(s, encoding=None, cls=None, object_hook=None, parse_float=None,
#        parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)
#load(fp, encoding=None, cls=None, object_hook=None, parse_float=None,
#        parse_int=None, parse_constant=None, object_pairs_hook=None, **kw)
#引數分析：
#encoding:指定編碼風格
#parse_float:如果指定，將把每一個JOSN字串按照float解碼呼叫。
#            預設情況下，相當於float(num_str)
#parse_int:如果指定，將把每一個JOSN字串按照int解碼呼叫。
#            預設情況下，相當於int(num_str)
new_str = json.loads(json_str)
print new_str
with open('qiye.txt','r') as fp:
    print json.load(fp)

#以上為講解python操作JSON；
#接下來接著例子把提取到的標題，章節和連結進行JSON儲存：
import json
from bs4 import BeautifulSoup
import requests
user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT）'
headers={'User-Agent':user_agent}
r = requests.get('http://seputu.com/',headers=headers)
soup = BeautifulSoup(r.text,'html.parser',from_encoding='utf-8')
content=[]
for mulu in soup.find_all(class_="mulu"):
    h2 = mulu.find('h2')
    if h2 != None:
        h2_title = h2.string #獲取標題
list=[]
        for a in mulu.find(class_='box').find_all('a'): #獲取所有的a標記中url和章節內容
href = a.get('href')
            box_title = a.get('title')
            list.append({'href':href,'box_title':box_title})
    with open('qiye.json','wb') as fp:
        json.dump(content,fp=fp,indent=4)

資料儲存(無資料庫版)之一：儲存為JSON

#coding:utf8 #使用Requests訪問http://seputu.com/，獲取並列印HTML文件內容 import requests user_agent = 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'

PHP留言板無資料庫版

---恢復內容開始--- 今天寫完作業研究一個留言板，起初主要構想是在PHP和HTML分別寫一個HTML用於首頁表單樣式，PHP用於處理留言程式，先看下HTML首頁吧！我先講在index.php檔案中植入HTML的表單，然後在頭部處理留言內容。處理完了以後再一下表格中顯示。主要思路是將留言內容以

【技術實驗】Elasticsearch 做資料庫系列之一：表結構定義

點選有驚喜 Elaticsearch 有非常好的查詢效能，以及強大的查詢語法。在一定場合下可以替代RDBMS做為OLAP的用途。但是其官方查詢語法並不是SQL，而是一種Elasticsearch獨創的DSL。主要是兩個方面的DSL：這兩個DSL說實話是不好學習和理

前端十萬個為什麽(之一)：我們為什麽需要npm？

重要 col 以及檢索 xxx 存在你在語句 16px p.p1 { margin: 0.0px 0.0px 0.0px 0.0px; font: 12.0px ".PingFang SC"; color: #454545 } span.s1 { font: 12.0

親測可用：將資料庫查詢結果DataReader轉換為Json

如果有其他型別的話，大概可以歸為兩類，需要加""的，和不需要加的，這裡我都有處理，可以直接在對應處新增型別即可。因為我查詢的資料裡牽扯到了datetime，所以我將其轉換成了string來處理 /// <summary> /// DataReader轉換為Js

簡單知識點例項之一：如何將各個單一獲取的資料儲存為陣列物件並將其取出

一、將獲取的值存為陣列或陣列物件（1）存為陣列（例如所有怪物的id值可以存為陣列）是以逗號隔開的，建議用到存單個特定值時用（如光存id值時） <!DOCTYPE html> <html lang="en"> <head> <

例項：建立一個表格，分頁顯示資料（MongoDB資料庫儲存），功能：實現增刪改查

需求：建立一個表格，分頁顯示資料，功能：實現增刪改查效果圖：自動建立一個專案命令列： express mongodb-demo --view=ejs cd mongodb-demo npm install npm install mongodb --save npm sta

Android開發（2）：資料儲存之一：SharedPrefrences和檔案讀寫

一、資料儲存本文主要講前兩種儲存方式，其中檔案讀寫只記錄Internal Storage方式 1. SharedPrefrences方式輕量級NVP方式儲存，以XML的檔案方式儲存，適合少量資料的儲存。 NVP：Name/Value pair, 名稱/值對。 2.

Netflix資料庫架構變革：縮放時間序列的資料儲存

Netflix分析了其資料集的訪問模式，對檢視資料儲存架構進行了重新設計，並採用群集分片的資料分類方式，實時和壓縮資料並行的讀取模式。以尋求滿足更多的獨特需求與成本，效率的改進。本文來自Netflix技術部落格，LiveVideoStack對文章進行了翻譯。

《連載 | 物聯網框架ServerSuperIO教程》- 17.整合Golden實時資料庫，高併發儲存測點資料。附：3.4 釋出與版本更新說明。

目錄 17．支援實時資料庫，高併發儲存測點資料... 2 17.1 概述... 2 17.2 ServerSuperIO與實時資料庫對接... 4 17.2.1 繼承動態介面，

安卓資料持久化：檔案儲存、SharedPreferences儲存以及資料庫儲存

1，檔案儲存手機自帶的記憶體，只能供當前應用程式訪問，其他應用程式訪問不了，程式解除安裝這些資料也會隨著消失原理：基本是先獲取一個檔案的輸出流，然後把資訊write進去，最後關閉流 a,通過上下文類context的openFileOutput()方法獲得一個FileOutputStream輸出流 b

Java資料採集：Xpath解析 + WebMagic案例：採集豆瓣豆列電影資訊儲存MySql資料庫

Maven的安裝與設定環境變數 2. 設定環境變數新建變數MAVEN_HOME，值為Maven的目錄X:\XXX\apache-maven-XXX 將%MAVEN_HOME%\bin新增到Path變數下 3. 檢測：執行CMD，輸入mvn -v後可以看到Mave

Oracle 資料庫體系結構（一）：儲存結構

目錄為什麼要學習體系結構？體系結構的定義 Oracle 物理結構 Oracle 邏輯結構總結為什麼要學習體系結構？之前的文章有講解到 MySQL 、MongoDB 資料庫，這些資料庫我們安裝好了就能拿來用，比如直接可以做一些：增、刪、改

資料基礎---《利用Python進行資料分析·第2版》第6章資料載入、儲存與檔案格式

之前自己對於numpy和pandas是要用的時候東學一點西一點，直到看到《利用Python進行資料分析·第2版》，覺得只看這一篇就夠了。非常感謝原博主的翻譯和分享。訪問資料是使用本書所介紹的這些工具的第一步。我會著重介紹pandas的資料輸入與輸出，雖然別的庫中也有不少以此為目的的工具

資料庫：儲存程式

目錄一、什麼是儲存程式？二、為什麼使用儲存程式？三、儲存程式分類四、儲存過程 1.儲存過程引數的3中模式 2.流程控制語句 3.示例程式碼五、儲存函式六、觸發器一、什麼是儲存程式？儲存程式指的是一組儲存和執行在資料庫伺服器端的程式。

大資料（二十二）：hive分桶及抽樣查詢、自定義函式、壓縮與儲存

一、分桶及抽樣查詢 1.分桶表資料儲存分割槽針對的是資料儲存路徑（HDFS中表現出來的便是資料夾），分桶針對的是資料檔案。分割槽提供一個隔離資料和優化查詢的便利方式。不過，並非所有的資料集都可形成合理的分割槽，特別是當資料要

日期型別的資料在Oracle資料庫中的儲存和查詢

使用Oracle資料庫，mybatis的對映檔案中日期型別的資料，如果定義為<result column =“UPDATED_DATE" jdbcType =“DATE” property =“updatedDate”/>，即使在後臺你為日期賦予年月日時分秒，但儲存到資料庫中將只

java使用poi把從資料庫中取出的資料寫入到excel檔案中並儲存到指定檔案路徑

　　有時候我們要把從資料庫中取出的資料匯入到excel中，使取到的資料看起來更加的直觀和方便，在java中如何實現取到的資料匯入到excel中呢？以下就是使用poi工具吧資料寫入excel檔案中的解決方法： Excel表格副檔名有.xlsx和.xls兩種格式 &n

python 將爬取的資料儲存在資料庫裡

python 將爬取的資料儲存在資料庫裡 import urllib.request import re import sqlite3 response = urllib.request.urlopen("https://search.51job.com/list/010000%252C

【資料結構】線性結構：儲存&運算&時間複雜度

版權宣告：本文為博主原創文章，未經博主允許不得轉載。 https://blog.csdn.net/shamingai/article/details/48914005 邏輯結構：表內元素的關係，共有集合、線性結構（線性表、棧、佇列、陣列）、樹形結構（樹、二叉樹、森林）、圖結構（圖）四種；

資料儲存(無資料庫版)之一：儲存為JSON

相關推薦