為什麼 StackOverflow 上的程式碼片段會摧毀你的專案?
昨天公司裡碰到一件令人啞然失笑的事情。幫朋友公司做的一個專案,做SIT測試的時候發現一些bug,仔細查了下原因,原來是因為當初覺得這個專案比較簡單,交給了幾個新入職的新丁,也算是給他們練練手,結果其中一位寫了一段程式碼出現了問題結果導致bug的出現。
雖然問題不大很快就修復了,但是正所謂初生牛犢不怕虎,這位出問題的新丁不太服氣,一直嚷嚷著他這段程式碼是從CSDN上找到的,別人都說好用他才用的。問了問他是否理解原文中那麼寫的原因,結果才支支吾吾了半天講不清楚,最後也承認他只是看到那段程式碼的結果是他要的,並不是理解中間一些方法的運用到底是什麼邏輯。
真是又好氣又好笑,想想現在的年輕人真是有個性,自己當年遇到這種情況只敢虛心求教,哪敢都沒明白就去用一段程式碼,別人指出問題還忿忿不平。
也許是自己老了吧。晚上和一個剛從國外歸國的同學說起這個事情,他倒是深有體會,說到他們在國外留學時,遇到技術問題想到網上諮詢用的最多的是StackOverflow,相比起國內的CSDN,他覺得StackOverflow上提問題的人和回答的人都更加嚴謹,不會有太多的廢話和問題之外的討論。按他的理解,CSDN上很多國內的技術新手純粹是缺乏獨立思考的能力,都只是來求程式碼完成目標,不去探究為什麼這麼寫,本身CSDN上問題回答質量不高,這樣很容易出事。
同學的看法,一方面可能是因為國內程式設計師需求極大,但整體浮躁、功利性的大環境導致很多培訓機構沒有培訓到位,很多程式設計師都是一邊開始工作一邊學習;但另一方面,不排除他崇洋媚外的自滿情緒。於是,我便去查閱了下StackOverflow上面的內容和相關資料。
仔細研究後發現,其實StackOverflow沒有同學說的那麼好,即使是該網站上的回答,也有很多有問題的程式碼。看來這還是一個世界性通用的難題~
對於國外的程式設計師來說,StackOverflow就是他們的CSDN,是他們遇到各種問題查詢的第一選擇,很多國外的程式設計師,會到StackOverflow上需求幫助,找到他們需要的解決問題的程式碼,然後不假思索的直接複製使用,和我公司出問題的那位年輕人一樣,這個習慣很不好。
程式碼複製本身來說並不是什麼壞事,我們學開發的時候,肯定老師都教過我們程式碼複用能有效提高軟體的開發效率。已經被解決了的問題,實在沒有必要再去重新寫一遍程式碼。但是這個前提是,使用者,也就是開發人員,必須知道你要用的這段程式碼的來龍去脈真正含義,就是你要真正明白你用的程式碼。
簡單舉個例子:
- 幾年前,很多程式設計師發現,在windows上使用Docker老是會碰到無法啟動的問題,原因一直不明,很多人都是重灌了系統什麼的才解決。後來有一個大神發文解釋原因後我們才知道了為什麼
當 Windows 後臺啟動了 Razer Synapse 時,再去啟動 Docker 就會觸發此問題。根本原因是,Razer Synapse 執行後,Docker 就會認為已經有一個 Docker 例項正在執行中,所以不會再啟動一個例項,也就是真的Docker。
為什麼會有這種情況呢?
因為有一段程式碼中,返回的 GUID 型別是 System.Reflection.RuntimeAssembly(系統層面的執行時程式集),而不是 Windows 中對應 Docker 程式集中定義的型別。Docker處理的邏輯就是在同一時間只允許執行一個例項,判斷的方式就是通過判斷 GUID 是否存在,但在獲取GUID 時,用的是系統層面的而非自己獨立程式集裡面,從而導致了這個問題。問題程式碼如下:
var name = string.Format("Global\{0}", (object)
Assembly.GetExecutingAssembly().GetType().GUID);
當然了,如果系統只有一個應用程式使用了上面的錯誤程式碼,那麼這個問題還是不會出現,因為只有一個例項。但實際情況是很多應用程式都使用了這一段錯誤程式碼,結果就不允許兩個例項同時執行。
那這些應用程式,想必你已經猜到,都用了這段程式碼,而且都是從StackOverflow上下載後不假思索的使用導致的。
- Andreas Lundblad,國外一位大神,Palantir 的 Java 開發人員,同時也是 StackOverflow 上排名最高的貢獻者之一。
他有一段程式碼,作用是將位元組計數轉換為更易於閱讀的格式。打個比方,1024位元組轉換為1kB,1048576 位元組轉換為1MB。他最初在2010年將這一段程式碼放到了StackOverflow上,根據官方統計,他的這段程式碼是StackOverflow上被拷貝次數最多的Java程式碼,GitHub上使用這段程式碼的專案有6千多個。
當Andreas Lundblad知道此事後,出於負責,很小心謹慎的重新檢查了下這段程式碼,隨後發現這段程式碼裡有一些問題,於是他馬上更新了版本,併發博告訴大家:
- StackOverflow 上的程式碼可能存在 bug,不管他的好評是多少。
- 如果你拿了StackOverflow的程式碼,一定記住要測試所有的可能的情況。
- 在複製程式碼時,一定要包括其來源和貢獻者,當出問題時,能快速幫你定位。
同樣的,在去年,國外另一位大神Morteza Verdi發表了一篇研究論文指出,StackOverflow上流傳最廣的一段c++程式碼存在著69個重大安全隱患漏洞,GitHub上使用這段C++程式碼的專案也有近3千多個。
所以,無論是StackOverflow還是CSDN,無論是國外和國內,都務必記住一點,在複用別人的程式碼時,一定要搞清楚別人程式碼的含義,並做好充分的測試工作,並不是說你運行了一次沒問題,就是真的沒問題,可能只是你運氣好,沒有觸發問題場景罷了。
引用 Ryan Donovan 的一句話,就是:
If you borrow things and you don’t understand the content of what you’re borrowing, then you fall in this trap of reusing code that has potential vulnerabilities. Then you are just spreading those things around.”
If you’re going to reuse code, you need to understand that code.
複用程式碼,一定要理解程式碼!
你複用程式碼時遇到過什麼問題?一起討論下吧!
歡迎關注我的公眾號:程式猿DD,獲得獨家整理的免費學習資源助力你的Java學習之路!另每週贈書不停哦~