1. 程式人生 > >HTTP基礎

HTTP基礎

計算機 http1.0 中小型 標示符 基礎 網絡 log 用途 試題

1.HTTP訪問服務器原理

客戶端輸入IP->查找本地hosts緩存->有則直接用獲取到的IP訪問服務器->服務器響應後返回客戶端->客戶端頁面顯示
->無則訪問本地的DNS服務器
->本地DNS有記錄,則返回IP給客戶端->->服務器響應後返回客戶端->客戶端頁面顯示
->本地DNS無記錄->訪問授權DNS(涉及DNS的解析->dig)->返回IP給客戶端->->服務器響應後返回客戶端->客戶端頁面顯示

2.HTTP協議(超文本傳輸協議)

1.http最重要的應用服務www服務,涉及最初的目的是發布和接受HTML頁面的方法。
www:萬維網,應用http協議
http:80
https:443
2.http1.0和http1.1的區別
查看http:
curl -I www.baidu.com
HTTP協議是無狀態協議。無狀態是指協議對於事務處理沒有記憶能力
http1.0:使得包含http1.0包含圖片的web頁面和交互式表格稱為可能
http1.0規定瀏覽器和服務器只是保持短暫連接,每次的請求都需要根服務器做鏈接,完成後斷開連接。
服務器不跟蹤每隔客戶也不記錄過去的請求。
http1.1:修復了http的缺陷,從擴展性,緩存處理,帶寬優化作了改進,增加了cache緩存,是使用最廣泛的
http1.1支持持久連接,在一個TCP連接上可以傳送多個HTTP請求和響應,減少連接和關閉的延時
http1.1增加了響應頭,請求頭增強了http請求
3.HTTP請求方法
在HTTP通信中,每隔HTTP請求都包含一個方法,用以告訴Web服務器端需要執行什麽具體的操作,比如提交內容等
GET :客戶端指定資源,服務器端返回指定的資源
POST:將客戶端的數據提交到服務器
PUT :從客戶端向服務器傳送的數據替代文檔的內容
DELETE:刪除

4.HTTP的狀態碼(16個)
200 ok
301 重定向,永久跳轉
403 禁止訪問,權限問題
404 頁面不存在
500 服務器錯誤,不能完成客戶請求。例如SELINUX開啟
502 網關錯誤 -->一般是代理請求後端,後端不響應導致
503 服務不可用,服務器停機維護等情況
504 網關超時,後端沒有在指定的時間內完成請求,
服務器過載導致沒有在指定的時間內返回數據給代理服務器

5.Http報文(2種)
請求報文
響應報文

6.Http協議請求的流程 -->http原理
1.客戶端輸入訪問地址 www.baidu.com
2.web瀏覽器將訪問地址解析成服務器的IP地址    -->DNS解析原理
3.瀏覽器將默認的端口號(80)從訪問的url中解析出來
4.根據 IP+端口,根服務器創建一條TCP的連接 -->3次握手
5.建立連接之後,開始給服務器端發送http請求報文
6.服務器響應並讀取信息,開始訪問門戶網站,集群,solar,訪問數據庫
7.返回響應報文給客戶端
8.WEB服務器關閉http連接,關閉tcp連接,WEB瀏覽器顯示信息

7.HTTP訪問的重要知識
1.用戶訪問網站流程
2.DNS解析流程細節
3.建立TCP後發送http報文
4.http的請求和響應報文細節
5.WEB服務器請求集群存儲的過程

8.HTTP協議的重要小結
1.HTTP位於OSI的第七層(應用層)
2.http協議的重要應用www
3.用戶上網流程,DNS解析原理
4.DNS獲取IP後建立TCP後發送http的細節
5.HTTP的請求報文與響應報文
6.HTTP服務接受請求後:nginx ->php ->數據庫

9.HTTP資源
1.媒體類型(MIME) -->多用途英特網郵件擴展
web服務器響應的時候,會為每一個http對象數據加一個MIME類型,用來區別文件的類型
2.URL 統一資源定位符
協議 IP(端口) 具體位置
http:www.baidu.com/index.html
3.RUI 統一資源標示符號
URL是URI的子集
標示某一互聯網資源名稱的字符串,這個字符串在全世界範圍內唯一 [email protected]

10.靜態網頁的特征:
1.固定的URL地址
2.每一個網頁都是一個獨立的文件,都是服務器實實在在保存的實體
3.內容固定,易被搜索引擎收入
4.沒有數據庫支持
5.沒有交互
6.接受並發訪問

11.動態網頁
1.php asp jsp
2.網頁一般是以數據庫技術為基礎,大大降低了網站的維護
3.可以實現更多地功能,用戶註冊,登錄
4.並不是獨立存在服務器的,單用戶請求時,服務器解析程序並獲取數據庫返回一個完整的網頁內容
5.偽靜態的數據處理,可以適應搜索引擎的抓取
6.曾需在服務器端解析,會消耗大量的CPU,內存等資源。

12.偽靜態的作用
優點:1.搜索引擎的動態抓取 2.較好的用戶體驗
缺點:1.會消耗資源,性能下降

13.生成web架構優化方案說明
1.考慮將用戶請求的數據解析後存成靜態文件存放在磁盤或內存,降低動態服務器的壓力,節約成本

14.CDN的全稱是Content Delivery Network,即內容分發網絡。
其基本思路是盡可能避開互聯網上有可能影響數據傳輸速度和穩定性的瓶頸和環節,使內容傳輸的更快

3.網站流量度術語


1.IP
獨立IP指的是不同IP地址的計算機訪問網站的被計算的總次數
2.PV-->page view
3.UV(Unique Visitor) ->獨立訪客-->接近真實
同一臺客戶端訪問同一個網站一天之內被計算為一個訪客
4.企業網站對PV/IP/UV的度量
1.分析所有Web服務器的訪問日誌,對IP地址段進行去重
awk ‘{print $1}‘ h.log|sort|uniq -c|sort -rn
2.網站的結尾潛入一個js,利用js進行統計,寫入數據庫
3.利用第三方的統計谷歌等
5.並發連接
1.每秒能夠接受的最大用戶的請求數
2.每秒能響應的最大用戶數量
3.單位時間內能夠處理的的最大的連接數 -->推薦
100臺 -->的並發 IP量 百萬 PV 500W-1000W/day
10 -->5000 PV 20W
6.網站度量的面試題
你們公司的訪問量是多少?怎麽計算?
IP PV 並發量 3個點
運維日誌 JS訪問程序 第三方統計/GA等
7.主流WEB服務
1.apache: 中小型web服務,WEB的老大哥 -->主力2.2
2.nginx: 大型網站的主流 -->更新速度快 目前1.6.2

1.PHP:動態網頁語言PHP程序 ->配合apache解析
2.TOMCAT:中小企業動態web服務,互聯網Java容器
3.RESIN:世界上最快的WEB服務,java程序的解析器

HTTP基礎