搜尋引擎手記(一)之引擎工作的開始
陰、南風,天空依舊沒有太陽。
專案的進展好比這天氣一樣,說變就變。搜尋引擎的會議開完了。會議開完了的同時,也宣告去年一年的引擎專案的開發以失敗而告終。沒有思路、沒有規劃、沒有計劃,專案的失敗也必然的。雖然專案開始時候,大家都預見到了結局,但是當結局來臨的那一刻,心情還是沉重。
失敗是成功之母,可是我敢說,對於大多數人來說,一直苦嘗失敗的滋味,成功對他們而言是那麼的遙不可及。
探討專案的問題,開始新的嘗試了。下週先出來規劃,下週開會再討論,小心翼翼的堅實的走好每一步。
窗外,兩顆不知名的樹,枯黃的樹葉在風中搖曳,使勁的堅持著,不肯落下。
遠方的天空,天空依舊沒有太陽。
2015年3月16日(星期一)
多雲、南風,天空依舊沒有太陽。
天氣變了,專案終於也有進展了。早上到公司開啟郵箱,看了一下郵件。資料組主題詞的提綱出來了,幾行寥寥幾行的條目。工作進展還是沒有想象的順利。
萬事開頭難,萬事畢竟開始了。
我望了望了窗外,幾個光禿禿的樹幹,倔犟的直刺著灰暗的天空,天空依舊沒有太陽。
相關推薦
搜尋引擎手記(一)之引擎工作的開始
2015 年 3 月06 日 ( 星期五 ) 陰、南風,天空依舊沒有太陽。 專案的進展好比這天氣一樣,說變就變。搜尋引擎的會議開完了。會議開完了的同時,也宣告去年一年的引擎專案的開發以失敗而告終。沒有思路
搜尋引擎手記(三)之網頁的去重
015 年4月1日 ( 星期二 ) 晴 南風 今天是愚人節,我們給同事過愚人節,爬蟲也讓我們技術部過了愚人節。通過對抓取資料的分析,發現有20%的資料都是重複資料。開會討論,原來有兩個問題,一個爬蟲引擎有重大bug;另外一個問題,竟然對網頁沒有做去重處理
搜尋引擎手記(二)之爬蟲的開發
2015 年 3 月23日 ( 星期一 ) 晴、南風 今天資料組開會說爬蟲已經開發完畢,在嘗試爬網站。由於我們採集的網站,網址都是固定的,並且爬蟲網頁深度為3。不需要像heritrix這些通用爬蟲那麼強大的功能。 爬蟲主要採用了httpclient和htm
【SpringMVC】7.REST風格的CRUD實戰(一)之前期工作
一、什麼是REST和CRUD? 1.有關REST 有關REST的解釋我已近在之前的SpringMVC系列文章提到過,如果有興趣的同學可以翻看《【SpringMVC】3.REST表現層狀態轉換》進行檢視。 2.有關CRUD In comp
(一)模板引擎之velocity介紹
Velocity 什麼是velocity? Velocity是一個基於java的模板引擎(template engine)。可以使用簡單的模板語言(templatelanguage)來引
Activiti工作流框架學習(一)之通用資料表詳細介紹
文/朱季謙 Activiti工作流引擎自帶了一套資料庫表,這裡面有一個需要注意的地方: 低於5.6.4的MySQL版本不支援時間戳或毫秒級的日期。更糟糕的是,某些版本在嘗試建立此類列時將引發異常,而其他版本則不會。執行自動建立/升級時,引擎將在執行DDL時更改它。使用DDL檔案方法時,既可以使用常規版本也可以
劍英的區塊鏈學習手記(一)
strong mage git 人生 極客 lease 黑錢 開篇 png 開篇布拉拉 因為參與了小蟻的c#智能合約編譯器的開發,讓我第一次近距離接觸到區塊鏈技術。 以前我對區塊鏈技術的了解,只知道有一種叫做比特幣的玩意兒,以前有同事在幾百塊一個比特幣的時候屯了一批,後
地址映象和變換(一)之主存虛存
規則 根據 pan 命中率 實現 -s tro 分享 使用 地址映象:是將每一個虛存單元按某種規則裝入實存,即建立多用戶虛地址與實存地址之間的相應關系。 地址變換:是程序依照這樣的映象關系裝入實存後。在運行時,多用戶虛地址怎樣變換成相應的實存地址。 頁面爭用(實頁沖突
web框架(一)之基礎簡介
-a 程序 我想 pos 客戶 創建 當前 自動 art http的請求聲明周期:域名----DNS服務器---IP地址---基於tcp協議的http協議發送請求協議,服務端返回響應頭+響應體(我們所看到的頁面(是經過js渲染的,接收的是字符串))服務端(web服務)根據我
(一)JAVA Web工作原理
服務器 t對象 對象 如果 servle bsp servlet實例 init () servlet的運行過程: web服務器收到客戶端的HTTP請求後, 1)web服務器首先檢查是否已裝載並創建了該servlet的實例對象,如果是,直接第4)步。
數據庫中間件 Sharding-JDBC 源碼分析 —— SQL 解析(一)之語法解析
sharding-jdbc關註微信公眾號:【芋艿的後端小屋】有福利:RocketMQ / MyCAT / Sharding-JDBC 所有源碼分析文章列表RocketMQ / MyCAT / Sharding-JDBC 中文註釋源碼 GitHub 地址您對於源碼的疑問每條留言都將得到認真回復。甚至不知道如何讀
Linux I2C(一)之常用的幾種實例化(i2c_client ) 【轉】
掃描 sent near 通過 完成 check 根據 pup views 轉自:http://blog.csdn.net/lugandong/article/details/48092397 版權聲明:本文為博主原創文章,未經博主允許不得轉載。 目錄(?)
數據結構(一)之鏈表
存儲 鏈表操作 author void 復雜 pac 部分 地址 插入 一、鏈表 鏈表是一種物理存儲單元上非連續、非順序的存儲結構,數據元素的邏輯順序是通過鏈表中的指針鏈接次序實現的。 鏈表由一系列結點(鏈表中每一個元素稱為結點)組成,結點可以在運行時動態生成。每個
tensorflow筆記(一)之基礎知識
輸入 gpu oat baidu nump 通過 img ubuntu下 能力 tensorflow筆記(一)之基礎知識 版權聲明:本文為博主原創文章,轉載請指明轉載地址 http://www.cnblogs.com/fydeblog/p/7399701.html 前言
JDBC(一)之細說JDBC
這一 操作 對應關系 rep throw tco 接口 nag cep Properties info = new Properties();//要參考數據庫文檔 info.setProperty("user", "root"); i
java學習——java基礎(一)之概念解析
userinfo shuf cdn pdm shu href ember sig lower 鵲拙崩系06凳q毫乙6http://docstore.docin.com/sina_6341933819 6j50uk佬詼4wn刮掖http://shequ.docin.com/
TCP/IP(一)之開啟計算機網絡之路
廣域網 概述 pic .cn 慢慢 internet 通信 hub album 前言 在一段時間裏,都很想知道一臺電腦怎麽跟另一臺電腦通信的,我發送一個qq給女朋友,怎麽準確的發送過去的,又是怎麽接受消息的。 接下來一段時間給大家慢慢分享關於計算機網絡的相關知識。 一、局域
JavaWeb(一)之細說Servlet
troy 文件名 ngs 很多 generics 頁面 虛擬 ats att 前言 其實javaWeb的知識早就學過了,可是因為現在在搞大數據開發,所以web的知識都忘記了。準備開始慢慢的把Web的知識一點一點的回憶起來,多學一點沒有關系,就怕到時候要用的話,什麽都不
CentOS7 +vsftpd (一)之 匿名
網絡設備 scripts /usr yml list packet 如果 sting cmp CentOS7 +vsftpd (一)之 匿名 ftp的搭建是一個基礎性的工作,CentOS7 +vsftpd 是一個比較容易實現的平臺,但在搭建中問題會不少,本系列將通過四篇隨筆
Hadoop(一)之初識大數據與Hadoop
hive 程序員 http 關系型數據庫 .com 邏輯 使用 alt clu 前言 從今天起,我將一步一步的分享大數據相關的知識,其實很多程序員感覺大數據很難學,其實並不是你想象的這樣,只要自己想學,還有什麽難得呢? 學習Hadoop有一個8020原則,80%