1. 程式人生 > 其它 >3.1 預答辯覆盤及後續大論文修改工作

3.1 預答辯覆盤及後續大論文修改工作

預答辯已經過去一週多了,今天終於沒有其他的學習任務,可以好好覆盤一下了。這次一共有四名同學,我是最後一個,雖然勉強跟著大家一起過了,但因為一些其他的原因,還是要延畢了。因為大論文寫的比較倉促,還是比較爛的,多出來半年的時間可以好好改改,然後好好找工作。

在這個環境裡的人都是神仙打架,他們的專業能力都非常強,但這麼多年我雖然比較蠢笨但也算是摸索出了自己的生存之道。前三個同學做的東西都很好,但是老師也還是提出了很多問題和建議,很多也是我應該注意和學習的。


第一個同學是 WYK,是做安全的,被問了很久。主要問題如下:

  1. 沒有研究問題的整體框架,各個點比較散;
  2. 表格不合規,標題、引數名都沒有;
  3. 一年的工作內容。因為是延畢一年,所以會問到一年間額外做了哪些工作,如果是多做的工作,未經過審稿論證的,可以先把工作寫上,經過審稿論證的,把結論寫上;
  4. 文獻羅列不可取。我也是一樣的問題,寫研究現狀就是簡單羅列,沒有深層次比較分析;
  5. 整體做得比較淺。老師們大多都是安全出身,所以看問題還是一眼中的,其實我也是存在同樣的問題。

高老師對該同學的問題進行了總結:

  1. 要保證大論文的篇幅。但是該同學把不相關的內容加上去了,反而是減分項。應該把不相關的刪掉,減少重複。
  2. 關於如何增加論文篇幅,為什麼會沒得寫,高老師給出的建議感覺還挺有用的:把工作做細,就有的寫。實驗條件、環境,所得結果的最大值、最小值、平均值等。
  3. 有不規範的表述,表述比較口語。我覺著我也是一樣的問題。

中間我導師也提了很多,重點是增加論文的篇幅、乾貨。最後立武也提了幾點,和前面幾條有重複的:

  1. 要明確目標,該補的章節補上;
  2. 寫專業內容相關的東西,無關的刪掉;
  3. 大面上大家都知道的東西,刪掉,這些說不說無差別;
  4. 用詞、語句不嚴謹,如 CIA 的定義,基本概念不能挑戰、改寫。

第二個是郭老師,郭老師做的工作比較多,呈現得也非常好,老師們說論文寫的很規整,基本沒有提太多問題。
只有立武老師提了幾個小的注意事項:

  1. 摘要不要出現文獻引用;
  2. 對於知識的定義。這個老師每次都會提到這個問題,並給出了建議:浙大、陳華鈞《知識圖譜導論》裡面應該有,還提到 DIPW……,認知、感知、推理等。
  3. 對於 AI 核心問題的探討。老師提了一個問題,問 AI 的核心問題是什麼?我當時想的答案是“意識計算”,老師給出的答案是 “知識表示和利用”,但是 卻並不看好 KGE 的發展,我覺得非常贊同。

第三個是 HSK 師兄,做的是推理問答系統,比較偏應用。師兄有 5 篇論文,工作量也是非常充實了。老師們主要提出的問題如下:

因為師兄是最後才講框架,姚老師指出研究框架應該放在前面來講。而且我看到很多師兄師姐會把研究框架單獨成為一章,用於強調自己各項研究內容之間的關係,但是我導指出框架最好是合到某一章節之中自成一章略顯單薄。

翟老師提出了非常犀利的問題:文字知識的問答系統,很多人都在做,你的創新性在哪裡?複雜推理也有人做,效果如何,與別人的不同?比別人(別的機構)強在哪裡,研究的到底是不是一個科學問題。Anyway 都是很根本性的問題。這裡想到我的缺陷,就是對於現在做到什麼程度,講的也不是很清楚;對於研究的問題,也應當確定是舊問題還是新問題,如果是新問題,最好有一個明確的定義。

立武老師提出的問題:圖中文字太小、圖的質量不好。又提到了知識的概念,資料庫與知識庫的異同:資料庫不需要多次互動,而問答系統比檢索系統需要多次與人的互動。這裡提到一個新詞:知識系統,指的是可以和人沒有互動的系統,將文字視為黑盒。知識如果定義清楚了,可能不需要歧義處理了。這位老師說自然語言結構化是可以做的東西。我覺得很有啟發,這方面的工作或許是比較實用的。

一個心得:博士的研究不在多、而在精、細。當然工作量的體現也是一部分,但更重要的就是把一個問題做到極致的工作,關於對問題的分析、解決方法、詳細的實驗分析、為什麼好的解釋等。要把呈現出來的東西都搞清楚,才能無懈可擊。就是丁是丁卯是卯。


最後一個就是我了,我做的東西跟前幾位同學比起來立刻就是高下立見,但是老師們都非常 nice,都從幫我搞得更好能順利畢業的角度提出一些建議,沒有任何嚴厲的批評,我想老師們可能是出於同情吧orz。都是很有用的建議:

  1. Conv3D 效果很好,但沒有給出合適的解釋原因。這一點是一直就存在的問題,是每次都會被提到的缺陷,得需要找一個強有力的理由來說服自己和評閱人。高老師和逸飛師兄幫忙從視覺領域多通道推測了一下原因,嵌入向量堆到一起,可以抓住主成分,多通道類似並行多分量。後面看看影象領域的場景找找說法。可能還要具體說下引數的優勢,做一些更有說服力的實驗什麼的。不能總是呈現一個好的結果,然後泛泛地說模型架構的優勢。

  2. 翻譯特性應該具體解釋一下,\(h+r \approx t\);同理,語義模糊也應該有個明確的解釋。

  3. 第二章研究現狀純粹就是文獻堆砌,不可取。應當突出與後面工作的聯絡:從語義、關係角度介紹研究現狀:從卷積的語義空間呈現研究現狀。

  4. 資料集那章需要有一個可以推廣到其他領域的普適性方法。先說輸入、講方法的通用性,再說效果。要能延伸到其他領域,這個也得考慮下怎麼整。(高老師對翟老師所提問題的解圍和建議)

最後翟老師問了一個問題差點沒答出來,說我最後的資料集構建怎麼應用到其他領域,有什麼用,讓我說物流領域怎麼用,可是物流領域我真的不懂,勉強招架了幾句,最後提到了國網的主裝置知識庫,總算是圓過去了。

其他同學存在的問題我也應當改正的:

  1. 整體框架,幾個研究點成體系;
  2. 增加篇幅,實驗描述更詳細,要增加乾貨;
  3. 表述口語化問題。

自己想到的自己問題:

  1. 研究內容一中,我對於實體和關係的多義問題,沒有給出準確詳細的解釋說明;
  2. KG2GM 的應用場景:存在多義現象的場景;(表明自己做的東西的實際應用價值很重要)
  3. Conv3D 的優勢:在維度低的情況下比其他模型好;
  4. 現在做到什麼程度沒有清晰描述,提出新問題要有定義。
    (我的幾個研究內容都比較粗糙,可能需要再搞細一些;可能不需要加太多新的東西了,把現在這幾個呈現清楚就好了)
  5. 檢查圖片呈現效果。

雖然也給答辯時候的自己錄了音,但還是沒有勇氣開啟聽。這次答辯又是沒有提前練習預講,總還是感覺自己做的東西很雞肋。後面時間比較寬裕,就應該準備得更充分一些。雖然多了半年,但要消化過去半年進展過快帶來的歷史遺留問題,還要找工作,也不會太清閒。1月是個比較尷尬的時間點,但也就這麼定了吧,在自己的世界,解決自己遇到的問題。後面的工作就是把之前攢的學習資料整理一下,然後根據上面列的問題改論文。