http與www服務概念詳解
HTTP超文本傳輸協議
html頁面標記語言
www萬維網
端口21 ftp
22 ssh
25 smtp
3306 mysql
873 rsync
161 snmp
111 rpc
3389
80
443 https
110 pop3
53 dns
curl -I www.baidu.com 查看網站頭部信息 200表示服務器返回成功。
http請求流程:
osi模型中的應用層協議,http協議的重要應用是www服務
獲取ip在dns本地緩存表查找,網關DNS查找
dns解析流程
建立TCP連接
用戶訪問網站基本流程
html、xml,shtml,jpg,js,css,swf,avi,wmv,flv等都屬於靜態頁面。
靜態網頁容易被搜索引擎收錄,所以很多時候需要將動態轉成靜態便於排名靠前增加點擊率。
靜態網頁沒有數據庫支持,所以大量信息的網站不適合用靜態的。
動態網頁:服務端解析,效率遠不如靜態網頁。用戶註冊、用戶登錄、在線調查,投票、用戶管理、訂單管理、發博文等。asp、aspx,php,jsp,do,並且常伴隨?,&等。
架構優化:效率很差,並發也很低,盡可能轉換成靜態網頁提供服務。
靜態:動態-------10:1 系統架構師和程序架構師的職責。
偽靜態就是將動態偽裝成靜態,其實還是動態,主要是修改了域名地址,目的是便於搜索收錄,但並不能提升網站的性能,反而下降,轉換時消耗資源。並發量不是很大時可以做偽靜態,更新頻率很快的業務也沒必要做動轉靜,偽靜態就非常好。
異步,消息中間件、消息隊列就是讓動態轉靜態。
web3.0是web2.0的替代物,以用戶為中心,動態頁面為主,智能化人與人機器的交流。10兆,全視頻的網絡,這才像web3.0。
傳統頁面布局:表格
現在:DIV+CSS,載入更快,降低流量成本提升用戶體驗,更有效率,保持視覺一致性,有利於搜索引擎收錄,對瀏覽者和瀏覽器更具有親和力。
java的解釋器:tomcat(小型互聯網公司)/resin( 大型互聯網公司)/weblogic(傳統行業)/jboss(淘寶)
趕集網:日200-300萬人訪問。
PV:PAGE VIEW 頁面瀏覽量或點擊量,用戶每次刷新即被計算一次。用戶發出,服務器回饋就叫一個pv,打開一個頁面就一次
如果一個用戶訪問趕集網,你覺得平均會產生多少pv?幾個-幾十個
趕集網日ip300萬,那麽你估計下pv能有多少,3000萬+。吹牛可以說pv,最主要的是有多少人看到,這才是廣告商中意的。
uv:一個人訪問記一個uv,通過不同技術方法來記錄,實際會有誤差。每次請求的信息內部都包含了你電腦的一些信息,比如:ip地址,請求發出的時間,瀏覽器版本,操作系統版本等等。也就是滿足同一共同特征的就叫同一ip。問題是多人一個電腦。
ip/pv的度量:
pv的度量
1、分析web服務的訪問日誌(排除js、css各種圖片),html,php。
2、在所有頁面結尾,嵌入js程序(GA),傳給統計服務器。
3、用第三方大家比較信任的統計工具(GA)。
ip的度量:
1、分析web服務的訪問日誌,去重。
2、在所有頁面結尾,嵌入js程序(GA),傳給統計服務器。
3、用第三方大家比較信任的統計工具(GA)。
session()和cookie(客戶端用戶)的區別是uv的一個補充,也就是瀏覽器發出請求後,服務端會發一個cookie放在客戶端的c盤,這個cookie也包含了服務器信息,訪問時間,訪問了哪些頁面等等。也不太精準,比uv好點,但很多用戶手動刪了cookie就統計不了了。
並發:每秒網站服務器最大響應的用戶請求數?
正確理解:單位時間內,服務器能夠同時處理的最大連接數。
查看網站排名、ip、pv的地址:
http://alexa.chinaz.com/?domain=google.com
查看網站排名的地址:
http://www.alexa.com/siteinfo/weibo.com
網站 | ip(萬) | pv(萬) | 機器數 |
www.51cto.com | 40 | 80-100 | 30臺 |
www.ganji.com | 120-150 | 1000-1200 | 200 |
www.58.com | 100-12 | 1600 | 30-400 |
www.weibo.com | 3000-4000 | 10000-20000 | 1000多 |
www.taobao.com | 7000-8000 | 60000-100000 | 10000 |
awstats:抓取ip連接數然後排序,可查出ip連接的情況。
uniq:去重,把重復的行去掉。-c 去重計數。相鄰一樣的才能去重。
sort:對一個文本的行進行排序。-n按數字排序,-r倒序,-t分隔符,類似awk的-F,cut的-d,-k指定按哪列排序。
awk -F “/” ‘{print $3}’ oldboy.log|sort|uniq -c|sort -nr 去重計數按倒序排列。
http與www服務概念詳解