怎樣做研究(三) 劉挺
怎樣選題
前文曾提到科學研究的層次,並分了6個層級。此處所說的選題指的是從C到E三個層次上的選擇問題,即:C. 研究方向、D. 子方向、E. 課題。選擇研究方向是實驗室(Lab)主任們需要重點思考的事情,選擇子方向是研究小組(Group)的組長們需要重點思考的事情,選擇課題是研究生們需要重點思考的事情。
選擇太多,很容易讓人困惑,要想理出一個頭緒來,需要一些基本的原則。微軟的許峰雄來訪時談到了他選擇課題的三個標準:有足夠的興趣,能成為世界第一,能賺錢。(!)興趣,這個原則是非常重要的,我贊同,獲得國家最高科技獎的“黃土之父”劉東生院士是搞地球環境科學的,經常在野外作業,按常人推斷,這該是多麼枯燥艱苦的工作啊,但他說:“枯燥?不!因為經常有新發現,其中的樂趣難以形容”。我堅信任何一個成功的科學家的直接工作動源都是興趣,而不是意志。(2)成為世界第一,不容易,但是應該作為一種判斷標準,如果某個領域已經非常成熟,很難有什麼創新了,或者大牛雲集,已經打破頭了,則應該有所迴避。(3)賺錢,許峰雄是在工業研究院中工作,比較注重實用,因此他強調了“賺錢”,我是在工科大學裡工作,也比較偏重應用,因此是贊同“能賺錢”這個標準的。不過,“能賺錢”不等於立即賺錢,5年、10年,20年後能夠賺錢的研究課題都是值得關注的。
談談我選擇課題的一些體會:
1、 要有實際需求
一個課題必須有實際需求,可能是現實的需求,也可能是潛在的需求;可能是直接的需求,也可能是間接的需求,總之是的的確確被人們所需要的。據個反例,比如自動文摘,自動文摘是我的博士論文課題,但是實際應用需求始終不清楚,自動文摘的結果用於編輯出版,質量肯定無法保證,用於幫助人們快速瀏覽資料吧,Google提供的包含查詢詞的簡單的Snippet就起到了這個作用,因此,至今基於全文分析的單文件自動文摘到底用到哪裡,仍然不清楚,這方面的研究已經有50多年的歷史了,仍然是不死不活,總是找不到應用就無法得到政府和企業界的持續性支援,以往的付出成為雞肋。我覺得單自動文摘不是一個好課題,目前階段多文件文摘,或者說對某個題目的自動綜述分析是非常好的題目。
2、 有較大的未知空間
以手寫體漢字識別為例,市場上已經大面積應用了,在研究上就不宜再展開。
3、 與自己以往的工作有關聯
如果你覺得自己的研究領域太窄,或者競爭對手太多,或者自己缺乏興趣,則可以適當擴充套件研究方向,但最好是相關性地擴充套件,比如從自然語言處理(NLP)擴充套件到資訊檢索(IR),IR要用到NLP的技術,這種擴充套件是從底層技術到應用系統的擴充套件,很自然。再比如從圖片檢索擴充套件到視訊檢索,只是處理物件有變化,很多原有的技術優勢仍然能夠發揮。如果跳躍性太大,比如搞NLP,忽然發現做資料探勘有前途,於是單純地轉向資料庫中資料探勘,和文字處理完全脫節,這種做法一方面無法發揮既有的技術積累,另一方面也讓同行感覺你不夠專注,不容易得到認可。最要命的是有的人根本就沒有自己的方向,什麼課題都敢接,這樣的人可以一時間讓人覺得風風火火,經費也很充足,但過不了多久就會摔落下去,因為缺乏積累,學術形象不清,公雞下蛋,幹了自己不擅長的事情,在學術圈還怎麼混?
4、 有可能得到國家的支援
對於資深學者,他選定一個課題後,可以寫出立項建議,去說服政府或軍方支援他的工作,從而填補國家空白,成為國內這個方向的先驅。哈工大的楊孝宗老師借鑑CMU在wearable computing方面的研究成果,在國內率先提出穿戴計算機的概念,堅持多年,就獲得了軍方的認可。對於剛出道的年輕人,無力直接影響政府,那只有自己預先判定一個幾年後可能成為熱點的方向,先走一步,做出一些成績來,等到大氣候適宜的時候,由於他已經取得了一定的成果,也有可能被認可為這個領域的先行者,得到國家的支援。
課題的型別
對一個課題的型別要有一個判斷,是研究型的還是開發型的,如果是研究型的,要組織博士生們來攻關,鼓勵大家大膽嘗試,提出創見;如果是開發型的,要更多地召集碩士生們來做,強調利用一切現有的技術手段把技術或系統做到實用可靠。這兩者要分的比較清楚,既不能通過各種打補丁的方法,或者說一大堆小技巧來對付研究型的課題,因為那樣是做不出突破性進展的,也不能在開發類課題上總是異想天開,嘗試還很不成熟的技術。
如果是研究型課題,還要區別是基礎研究還是應用研究,基礎研究的結果不能直接被使用者使用,類似重工業,應用研究的結果終端使用者直接就能夠用上,類似輕工業。對於基礎研究,可以拋開具體應用的約束,專注於一些科學原理技術原理的突破。對於應用研究,則需要考慮使用者的需求。
課題還有長期(long term)和短期(short term)之分,長期研究的課題往往難度大,研究結果難以預料,短期專案則比較好預測,可以速戰速決。