1. 程式人生 > >http與www服務概念詳解

http與www服務概念詳解

互聯網

HTTP超文本傳輸協議

html頁面標記語言

www萬維網

端口21 ftp

22 ssh

25 smtp

3306 mysql

873 rsync

161 snmp

111 rpc

3389

80

443 https

110 pop3

53 dns

curl -I www.baidu.com 查看網站頭部信息 200表示服務器返回成功。

http請求流程:

osi模型中的應用層協議,http協議的重要應用是www服務

獲取ipdns本地緩存表查找,網關DNS查找

dns解析流程

建立TCP連接

用戶訪問網站基本流程

htmlxmlshtmljpgjscssswfaviwmvflv等都屬於靜態頁面。

靜態網頁容易被搜索引擎收錄,所以很多時候需要將動態轉成靜態便於排名靠前增加點擊率。

靜態網頁沒有數據庫支持,所以大量信息的網站不適合用靜態的。

動態網頁:服務端解析,效率遠不如靜態網頁。用戶註冊、用戶登錄、在線調查,投票、用戶管理、訂單管理、發博文等。aspaspxphp,jsp,do,並且常伴隨?&等。

架構優化:效率很差,並發也很低,盡可能轉換成靜態網頁提供服務。

靜態:動態-------10:1 系統架構師和程序架構師的職責。

偽靜態就是將動態偽裝成靜態,其實還是動態,主要是修改了域名地址,目的是便於搜索收錄,但並不能提升網站的性能,反而下降,轉換時消耗資源。並發量不是很大時可以做偽靜態,更新頻率很快的業務也沒必要做動轉靜,偽靜態就非常好。

異步,消息中間件、消息隊列就是讓動態轉靜態。

web3.0web2.0的替代物,以用戶為中心,動態頁面為主,智能化人與人機器的交流。10兆,全視頻的網絡,這才像web3.0

傳統頁面布局:表格

現在:DIV+CSS,載入更快,降低流量成本提升用戶體驗,更有效率,保持視覺一致性,有利於搜索引擎收錄,對瀏覽者和瀏覽器更具有親和力。

java的解釋器:tomcat(小型互聯網公司)/resin( 大型互聯網公司)/weblogic(傳統行業)/jboss(淘寶)

趕集網:日200-300萬人訪問。

PV:PAGE VIEW 頁面瀏覽量或點擊量,用戶每次刷新即被計算一次。用戶發出,服務器回饋就叫一個pv,打開一個頁面就一次

pv,打開一個鏈接就是一次pv,有些網站為防止刷pv會在頁面底部嵌入一個js來統計。

如果一個用戶訪問趕集網,你覺得平均會產生多少pv?幾個-幾十個

趕集網日ip300萬,那麽你估計下pv能有多少,3000+。吹牛可以說pv,最主要的是有多少人看到,這才是廣告商中意的。

uv:一個人訪問記一個uv,通過不同技術方法來記錄,實際會有誤差。每次請求的信息內部都包含了你電腦的一些信息,比如:ip地址,請求發出的時間,瀏覽器版本,操作系統版本等等。也就是滿足同一共同特征的就叫同一ip。問題是多人一個電腦。

ip/pv的度量:

pv的度量

1、分析web服務的訪問日誌(排除jscss各種圖片),htmlphp

2、在所有頁面結尾,嵌入js程序(GA),傳給統計服務器。

3、用第三方大家比較信任的統計工具(GA)。

ip的度量:

1、分析web服務的訪問日誌,去重。

2、在所有頁面結尾,嵌入js程序(GA),傳給統計服務器。

3、用第三方大家比較信任的統計工具(GA)。

session()和cookie(客戶端用戶)的區別是uv的一個補充,也就是瀏覽器發出請求後,服務端會發一個cookie放在客戶端的c盤,這個cookie也包含了服務器信息,訪問時間,訪問了哪些頁面等等。也不太精準,比uv好點,但很多用戶手動刪了cookie就統計不了了。

並發:每秒網站服務器最大響應的用戶請求數?

正確理解:單位時間內,服務器能夠同時處理的最大連接數。

查看網站排名、ippv的地址:

http://alexa.chinaz.com/?domain=google.com

查看網站排名的地址:

http://www.alexa.com/siteinfo/weibo.com

網站

ip(萬)

pv(萬)

機器數

www.51cto.com

40

80-100

30

www.ganji.com

120-150

1000-1200

200

www.58.com

100-12

1600

30-400

www.weibo.com

3000-4000

10000-20000

1000

www.taobao.com

7000-8000

60000-100000

10000


awstats:抓取ip連接數然後排序,可查出ip連接的情況。

uniq:去重,把重復的行去掉。-c 去重計數。相鄰一樣的才能去重。

sort:對一個文本的行進行排序。-n按數字排序,-r倒序,-t分隔符,類似awk-F,cut-d-k指定按哪列排序。

awk -F / {print $3} oldboy.log|sort|uniq -c|sort -nr 去重計數按倒序排列。


http與www服務概念詳解