1. 程式人生 > 其它 >10組-Alpha衝刺-6/6

10組-Alpha衝刺-6/6

# 一、基本情況 - 隊名:要有格局才對 - [組長部落格](https://www.cnblogs.com/Jimase/p/15574755.html) - 小組人數:10
# 二、衝刺概況彙報 根據擬定的團隊分工 - 在充分尊重大家意願的前提下、團隊分工如下(用名字唯一識別符號標識): - 前端組:萍、翁 - 後端組:石、林 - 資料組:碩、源、鬆、熙 - 管理組:蘇、唐 - alpha_6彙總: - 由於專案進入收尾階段、不要求組員每人繪製燃盡圖了、統一統計至組長處彙總 ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118201223671-1802170973.png)

|組名|第一階段分工|第二階段|第三階段|alpha階段|主任務| | -- | -- | -- | -- | -- | - | |前端組|原型設計、視訊|介面除錯|原型實現、UI優化|前端相關|前端相關 | |資料組|爬取可行性分析測試|資料收集|資料分析|資料相關|資料相關 | |後端組|資料庫搭建|後端構建、介面文件說明|後端完善|後端相關|後端相關 | |管理組(含測試組)|部落格撰寫、規劃|各組協調|測試優化、部署|測試、端茶倒水| 測試管理相關|

> ## 姓名:蘇偉煌(組長) > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.修復網頁顯示bug > - 2.GitHub部署 > - 3.緩解組員緊張情緒 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118204058025-50406978.png)

> - 接下來的計劃 > - main:收尾工作,bug修復 > - 重構程式碼 > - 測試功能 > - 還剩下哪些任務 > - 同上 > - 遇到了哪些困難 > - 藥監局攻堅爬取、最後用抓包手段解決 > - 有哪些收穫和疑問 > - 收穫:知道了用抓包的手段也可以在手機這種平臺爬取資料、很冷門的技巧,算是作為組長為數不多的小貢獻 > - 疑問:藥監局這種官方網站也會百疏一漏嗎 >
## 學習進度條 | 第N輪 | 新增程式碼(行) | 累計程式碼(行) | 本輪學習耗時(小時) | 累計學習耗時(小時) | 重要成長 | | ---- | ------- | ------- | ---------- | ---------- | ---------------- | | 1/6 | 0 | 0 | 5 | 5 | 網頁的基本佈局以及路由跳轉 | | 2/6 | 208| 208 | 4 |9 | 網頁的基本佈局以及路由跳轉 | | 3/6 | 211| 419 | 6 |15 | 網頁的基本佈局以及路由跳轉 | | 4/6 | 200| 619 | 6 |21 | 修改readme | | 5/6 | 190| 809 | 2 |23 | 修復資料顯示無法載入 | | 6/6 | 104| 913| 2 |25 | 修復網頁顯示bug |

## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |

> ## 姓名:王毅萍 > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.在藥品搜尋結果介面新增圖表 > - 2.幫組測試組解決藥監局爬取攻堅 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118201431046-442425094.png)

> - 接下來的計劃 > - main:修改樣式及修復部分bug > - 程式碼重構 > - 繼續UI完善 > - 還剩下哪些任務 > - 同上 > - 前端完善。 > - 遇到了哪些困難 > - 部分bug還未修復 > - 有哪些收穫和疑問 > - 收穫:和後端組溝通解決了跨域問題 > - 疑問:之前測試組豬尾巴的前端跨域問題和這次有些類似、但是合理的解決方法應該是後端修改 >
## 學習進度條 | 第階段 | 新增程式碼(行) | 累計程式碼(行) | 本輪學習耗時(小時) | 累計學習耗時(小時) | 重要成長 | | ---- | ------- | ------- | ---------- | ---------- | ---------------- | | 1/6 | 208 | 208 | 0 | 0 | 網頁的基本佈局以及路由跳轉 | |2/6|0|208|0|0|無| |3/6|210|418|5|5|無| |4/6|200|618|5|10|無| |5/6|109|727|5|15|修改樣式及修復部分bug| |6/6|89|816|2|17|在藥品搜尋結果介面新增圖表|
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |


> ## 姓名:翁敏 > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.解決跨域問題 > - 2.新增vue元件 > - 3.在github上查找了一些別人網站設計的思路。 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118200728646-1884799194.png)


> - 接下來的計劃 > - 1.解決問題,修復bug > - 2.我想複習下週的兩門考試,這個目前來說對我比較重要,如果時間允許還是會盡量多打程式碼構思如何儘快完成本組課題的專案開發 > - 還剩下哪些任務 > - 1.解決問題,修復bug > - 2.還有很多考試和大作業還沒有完成,任重道遠 > - 3.還沒有完全清楚瞭解如何使用vue完成網站開發
> - 遇到了哪些困難 > - 1.vue_cli安裝完成,再執行rpm run serve時,報錯,大概意思是config配置報錯(還是啥的),找了很多資料,還是無法解決,最終remake重灌了 > - 2.對一些vue程式碼模組使用不明白,再沒有文件或者視訊的介紹情況下還是比較難以理解的。 > - 有哪些收穫和疑問 > - 1.重灌vue_cli時候,直接把nodejs也給刪了(因為我覺得我當初nodejs安裝的路徑也有問題)於是就小心翼翼對著文件安裝nj和vue,看了別人的優秀文件,自愧不如,自己確實跟著學習到了很多東西,以前不懂的那些命令列指令各個字母串接再一起是什麼意思,別人的文件都一一闡述了,得到很多收穫。 > - 2.跟著視訊做了vue構建視訊的demo,vue確實很方便,以前用js進行頁面跳轉比較麻煩,vue內部自帶router模組方便快捷(不懂這樣描述是否正確) > - ## 學習進度條 | alpha輪次 | 新增程式碼(行) | 累計程式碼(行) | 本輪學習耗時(小時) | 累計學習耗時(小時) | 重要成長 | | ---- | ------- | ------- | ---------- | ---------- | ---------------- | | 1/6 | 462 | 462 | 11 | 11 | 對前端原型進行架構,介面除錯,以及安排分工前端組同學的任務 | | 2/6 | 300 | 762 | 4 | 15 | 對前端原型進行架構分析與設計 | | 3/6 | 200 | 962 | 2 | 17 | 對前端原型進行架構分析與設計 | | 4/6 | 200 | 1162 | 2 | 17 | 對前端原型進行架構分析與設計 | | 5/6 | 150 | 1312 | 3 | 20 | 對前端原型進行架構分析與設計 | | 6/6 | 121 | 1433 | 1 | 21 | 解決跨域問題 |
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 30 | | · Estimate | · 估計這個任務需要多少時間| 1020 | 1000 | | Development | 開發 | 300 | 250 | | · Analysis | · 需求分析 (包括學習新技術) | 200 | 100 | | · Design Spec | · 生成設計文件 | 10 | 10 | | · Design Review| · 設計複審| 50 | 50 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) | 50 | 50 | | · Design | · 具體設計 | 100 | 200 | | · Coding | · 具體編碼 | 100 | 300 | | · Code Review| · 程式碼複審 | 50 | 20 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 50 | 50 | | Reporting | 報告 | 30 | 50 | | · Test Repor| · 測試報告 | 30 | 30 | | · Size Measurement | · 計算工作量| 10 |10 | | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |10 | | | · 合計 | 1020 | 1160 |

## 姓名:陳本源(資料組) > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.增加了成功展示 > - 2.資料清洗 > - 3.bug修復,程式碼重構 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118200755334-720282843.png)

> - 接下來的計劃 > - 1.進行資料清洗 > - 2.繼續學習PyEcharts,對爬取到的資料,進行資料分析 > - 還剩下哪些任務 > - 1.對資料進行處理與分析 > - 2.生成視覺化圖 > - 遇到了哪些困難 > - 1.再爬取淘寶的過程中,由於網站的反爬機制,設定了cookies,成功爬取到頁面的相關資訊,但是由於本次任務爬取的資料量實在太過龐大,頻繁的訪問淘寶的url,導致連線多次被主動中斷,甚至出現ip被封,針對此問題本來打算使用selenium,通過動態模擬使用者點選行為,對頁面進行渲染,從而繞過反爬機制,實現爬取,但是該方法耗時長,對於本次任務需要爬取的巨大資料量顯然不適合。後又發現設定time.sleep設定url訪問間隔,但也同樣浪費時間,最後採用python自帶的fake_useragent庫,通過設定隨機頭對url進行訪問,大大降低了伺服器對機器爬蟲的認定概率,從而實現爬取53w條 > - 2.爬取比價網的過程中,同樣也是遇到了ip訪問限制,使用download_delay解決。 > - 有哪些收穫和疑問 > - 1.隨機頭方法在scrapy爬蟲框架中,似乎起不到什麼作用,導致爬取比價網的過程很煎熬, > - 2.瞭解了ip限制的解決方法。 > -
## 學習進度條 |Alpha衝刺| 新增程式碼(行)| 累計程式碼(行)| 本次學習耗時(小時)|累計學習耗時(小時)|重要成長與任務進展| | -- | -- | -- | -- | -- | -- | |1/6|442 |442 |10|10|和另一位組員一起對京東的藥品資訊資料進行爬取| |2/6|0 |442 |10|20|京東爬取| |3/6|0 |442 |4|24|bug修復| |4/6|0 |442 |4|24|bug修復| |5/6|120 |562 |4|24|資料清洗| |6/6|142 |704 |2|26|增加了成功展示|
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |

> ## 姓名:石致彬 > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.解決跨域問題 > - 2.學習spring系列框架 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118200819259-1481045783.png)


> - 接下來的計劃 > - 1.學習Web方面的知識 > - 2.修復bug,解決問題 > - 還剩下哪些任務 > - 1.學習web知識 > - 2.編寫介面 > - 3.學習雲伺服器的使用 > - 4.配置雲伺服器的環境 > - 5.部署到雲伺服器 > - 遇到了哪些困難 > - 1.時間不夠考試太多 > - 2.伺服器太貴了 > - 有哪些收穫和疑問 > - 1.學習了資料庫的相關知識 > - 2.學習了用Java操作資料庫 > - 3.疑問:我們真的做得完嗎
## 學習進度條 |Alpha衝刺| 新增程式碼(行)| 累計程式碼(行)| 本次學習耗時(小時)|累計學習耗時(小時)|重要成長與任務進展| | -- | -- | -- | -- | -- | -- | |1/6|563 |563 |14|14|和另一位組員合作對資料庫進行搭建,以及後端的搭建 | | 2/6 | 443 | 1006 | 12 | 26 | 學習了新技術 | | 3/6 | 431 | 1437 | 2 | 28 | 學習spring系列框架 | | 4/6 | 200 | 1637 | 2 | 28 | 學習spring系列框架 | | 5/6 | 211 | 1848 | 2 | 30 | 初步實現一些藉口 | | 6/6 | 185 | 2033 | 1 | 31 |解決跨域問題 |
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |

## 姓名:黃艇淞(資料組) > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.增加了成功展示 > - 2.bug修復,資料清洗 > - 3.資料傳送至後端 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118200852290-45887759.png)



> - 接下來的計劃 > - 1.繼續學習PyEcharts,對爬取到的資料,進行資料分析 > - 還剩下哪些任務 > - 1.對資料進行處理與分析 > - 2.生成視覺化圖
> - 遇到了哪些困難 > - 1.再爬取淘寶的過程中,由於網站的反爬機制,設定了cookies,成功爬取到頁面的相關資訊,但是由於本次任務爬取的資料量實在太過龐大,頻繁的訪問淘寶的url,導致連線多次被主動中斷,甚至出現ip被封,針對此問題本來打算使用selenium,通過動態模擬使用者點選行為,對頁面進行渲染,從而繞過反爬機制,實現爬取,但是該方法耗時長,對於本次任務需要爬取的巨大資料量顯然不適合。後又發現設定time.sleep設定url訪問間隔,但也同樣浪費時間,最後採用python自帶的fake_useragent庫,通過設定隨機頭對url進行訪問,大大降低了伺服器對機器爬蟲的認定概率,從而實現爬取53w條 > - 2.爬取比價網的過程中,同樣也是遇到了ip訪問限制,使用download_delay解決。 > - 有哪些收穫和疑問 > - 1.隨機頭方法在scrapy爬蟲框架中,似乎起不到什麼作用,導致爬取比價網的過程很煎熬, > - 2.瞭解了ip限制的解決方法。 > -
## 學習進度條 |Alpha衝刺| 新增程式碼(行)| 累計程式碼(行)| 本次學習耗時(小時)|累計學習耗時(小時)|重要成長與任務進展| | -- | -- | -- | -- | -- | -- | |1/6|352 |352 |7|7|和另一位組員一起對京東的藥品資訊資料進行爬取| |2/6|352 |704 |1|8|繼續和另一位組員一起對京東的藥品資訊資料進行爬取| |3/6|212 |916 |5|13|資料清洗| |4/6|200 |1116 |5|13|資料清洗| |5/6|220 |1336 |4|17|資料清洗| |6/6|220 |1336 |4|17|增加了成功展示|
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |

## 姓名:唐勁霆(管理組) > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.功能測試。 > - 2.部落格編寫。 > - 3.資料分析視覺化圖製作 > - 展示GitHub當日程式碼/文件簽入記錄:
![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118200055115-1774331779.png)


> - 接下來的計劃。 > - 1.製作更多的視覺化分析圖表。 > - 2.對功能進行測試。 > - 還剩下哪些任務 > - 1.對功能進行測試。 > - 2.製作更多的視覺化分析圖表。 > - 3.任務分工,問題商討。


> - 遇到了哪些困難 > - 1.考慮需要繪製哪些資料的視覺化分析。 > - 有哪些收穫和疑問 > - 1.學習了一些關於視覺化分析的知識。 > - 2.功能測試 ## 學習進度條 | alpha輪次 | 新增程式碼(行) | 累計程式碼(行) | 本輪學習耗時(小時) | 累計學習耗時(小時) | 重要成長 | | ---- | ------- | ------- | ---------- | ---------- | ---------------- | | 1/6 | 208 | 208 | 0 |0 | 各分工組反饋的問題商討解決,後端初步測試,部落格整合 | | 2/6 | 314 | 522| 6 | 6 |學習製作視覺化分析的相關知識,嘗試製作視覺化分析圖表 | | 3/6 | 321 | 843| 3 | 9 |製作更多資料視覺化分析圖表 | | 4/6 | 0 | 843| 3 | 12 |製作更多資料視覺化分析圖表 | | 5/6 | 310 | 1143| 3 | 15 |製作視覺化分析圖表 | | 6/6 | 114 | 1257| 4 | 19 |功能測試、製作視覺化分析圖表 |
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| | | | · Estimate | · 估計這個任務需要多少時間| 5 |5 | | Development | 開發 | 80 | 100 | | · Analysis | · 需求分析 (包括學習新技術) | 240 | 300| | · Design Spec | · 生成設計文件 | 0 |0 | | · Design Review| · 設計複審| 15|15 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |10 |10 | | · Design | · 具體設計 | 60 | 80 | | · Coding | · 具體編碼 | 140 | 120 | | · Code Review| · 程式碼複審 | 20 |25 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 20 |15 | | Reporting | 報告 | 60 | 60 | | · Test Repor| · 測試報告 | 0 |0 | | · Size Measurement | · 計算工作量| 10| 10| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10| 10| | | · 合計 | 670 | 750 |
> ## 姓名:林志煌 > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.新增資料視覺化分析 > - 2.程式碼重構 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118200935531-944128327.png)

> - 接下來的計劃 > - 1.新增echarts > - 2.繼續完善介面 > - 3.增加其他功能 > - 還剩下哪些任務 > - 1.完善 > - 2.增加功能 > - 遇到了哪些困難 > - 1.知識點大多都忘了,只能邊查邊做 > - 2.模板幾乎都是要收費的 > - 有哪些收穫和疑問 > - 1.收穫:複習了以前的知識,算是小鞏固 > - 2.疑問:暫時沒啥疑問
## 學習進度條 |Alpha衝刺| 新增程式碼(行)| 累計程式碼(行)| 本次學習耗時(小時)|累計學習耗時(小時)|重要成長與任務進展| | -- | -- | -- | -- | -- | -- | |1/6|362 |362 |10|10|和另一位組員合作對資料庫進行搭建,以及後端的搭建| |2/6|12|374|2|12|無| |3/6|110|484|2|14|無| |4/6|100|584|2|16|資料庫重構| |5/6|110|694|3|19|新增echarts| |6/6|110|694|3|19|新增資料視覺化分析|
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |

> ## 姓名:陳碩 > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.完善程式碼結構 > - 2.資料視覺化分析 > - 3.資料傳送至後端 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118201001627-158938507.png)

> - 接下來的計劃 > - 1.修復部分問題 > - 2.繼續學習PyEcharts,對爬取到的資料,進行資料分析 > - 還剩下哪些任務 > - 1.對資料進行處理與分析 > - 2.生成視覺化圖

> - 遇到了哪些困難 > - 1.爬蟲團隊在爬取淘寶的過程中,由於網站的反爬機制,設定了cookies,成功爬取到頁面的相關資訊,但是由於本次任務爬取的資料量實在太過龐大,頻繁的訪問淘寶的url,導致連線多次被主動中斷,甚至出現ip被封,針對此問題本來打算使用selenium,通過動態模擬使用者點選行為,對頁面進行渲染,從而繞過反爬機制,實現爬取,但是該方法耗時長,對於本次任務需要爬取的巨大資料量顯然不適合。後又發現設定time.sleep設定url訪問間隔,但也同樣浪費時間,最後採用python自帶的fake_useragent庫,通過設定隨機頭對url進行訪問,大大降低了伺服器對機器爬蟲的認定概率,從而實現爬取53w條 > - 2.爬取比價網的過程中,同樣也是遇到了ip訪問限制,使用download_delay解決。 > - 有哪些收穫和疑問 > - 1.隨機頭方法在scrapy爬蟲框架中,似乎起不到什麼作用,導致爬取比價網的過程很煎熬, > - 2.瞭解了ip限制的解決方法。 > -

## 學習進度條 |Alpha衝刺| 新增程式碼(行)| 累計程式碼(行)| 本次學習耗時(小時)|累計學習耗時(小時)|重要成長與任務進展| | -- | -- | -- | -- | -- | -- | |1/6|410 |410|9|9|和另一位組員一起對淘寶的藥品資訊資料進行爬取 | |2/6|410 |820|2|11|和另一位組員一起對淘寶的藥品資訊資料進行爬取 | |3/6|210 |630|3|14|資料清洗 | |4/6|0 |630|3|17|資料清洗 | |5/6|0 |630|3|20|繼續資料清洗 | |6/6|110 |740|2|22|完善程式碼結構 |
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |

> ## 姓名:林澤熙 > > - 過去兩天完成了哪些任務: > - 文字描述: > - 1.重新組織檔案結構 > - 2.淘汰部分圖表,更新最新圖的配色 > - 展示GitHub當日程式碼/文件簽入記錄: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118201030189-780187401.png)


> - 接下來的計劃 > - 1.繼續製作圖表 > - 2.繼續學習Pyecharts > - 還剩下哪些任務 > - 1.資料處理與分析 > - 2.資料視覺化 > - 遇到了哪些困難 > - 1.爬蟲團隊在爬取淘寶的過程中,由於網站的反爬機制,設定了cookies,成功爬取到頁面的相關資訊,但是由於本次任務爬取的資料量實在太過龐大,頻繁的訪問淘寶的url,導致連線多次被主動中斷,甚至出現ip被封,針對此問題本來打算使用selenium,通過動態模擬使用者點選行為,對頁面進行渲染,從而繞過反爬機制,實現爬取,但是該方法耗時長,對於本次任務需要爬取的巨大資料量顯然不適合。後又發現設定time.sleep設定url訪問間隔,但也同樣浪費時間,最後採用python自帶的fake_useragent庫,通過設定隨機頭對url進行訪問,大大降低了伺服器對機器爬蟲的認定概率,從而實現爬取53w條 > - 2.github使用不熟悉 > - 3.復現了組長的抓包爬取藥監局手段,完善了json欄位 > - 有哪些收穫和疑問 > - 1.瞭解了ip限制的解決方法。 > - 2.python第三方庫功能強大,需要自己多多瞭解和使用
## 學習進度條 |Alpha衝刺| 新增程式碼(行)| 累計程式碼(行)| 本次學習耗時(小時)|累計學習耗時(小時)|重要成長與任務進展| | -- | -- | -- | -- | -- | -- | |1/6|411 |411 |10|10|和另一位組員一起對淘寶的藥品資訊資料進行爬取| |2/6|10|421|1|11|重構程式碼| |3/6|110|531|2|13|資料清洗| |4/6|0|531|2|13|資料清洗| |5/6|0|531|2|13|繼續資料清洗| |6/6|103|634|3|16|重新組織檔案結構|
## PSP | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 30 | 72 | | · Estimate | · 估計這個任務需要多少時間| 1200 | 1600 | | Development | 開發 | 700 | 700 | | · Analysis | · 需求分析 (包括學習新技術) | 5 | 55 | | · Design Spec | · 生成設計文件 | 5 | 55 | | · Design Review| · 設計複審| 5 | 55 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |430 | 55 | | · Design | · 具體設計 | 120 | 120 | | · Coding | · 具體編碼 | 360 | 720 | | · Code Review| · 程式碼複審 | 50 | 50 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 30 | 50 | | Reporting | 報告 | 90 | 180 | | · Test Repor| · 測試報告 | 30 | 60 | | · Size Measurement | · 計算工作量| 10 | 20| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 1800 |
# 三、衝刺成果展示 ## PSP & 學習進度條(學習進度條每週追加) ### PSP(全隊) | PSP | Personal Software Process Stages | 預估耗時(分鐘| 實際耗時(分鐘) | | - | - | - | - | | Planning | 計劃| 300 | 720 | | · Estimate | · 估計這個任務需要多少時間| 12000 | 16000 | | Development | 開發 | 7000 | 7000 | | · Analysis | · 需求分析 (包括學習新技術) | 50 | 550 | | · Design Spec | · 生成設計文件 | 50 | 550 | | · Design Review| · 設計複審| 50 | 550 | | · Coding Standard | · 程式碼規範 (為目前的開發制定合適的規範) |4300 | 550 | | · Design | · 具體設計 | 1200 | 1200 | | · Coding | · 具體編碼 | 3600 | 7200 | | · Code Review| · 程式碼複審 | 500 | 500 | | · Test | · 測試(自我測試,修改程式碼,提交修改) | 300 | 500 | | Reporting | 報告 | 900 | 1800 | | · Test Repor| · 測試報告 | 30 0 | 600 | | · Size Measurement | · 計算工作量| 100 | 200| | · Postmortem & Process Improvement Plan | · 事後總結, 並提出過程改進計劃| 10 |100 | | | · 合計 | 1200 | 18000 |


- 組內最新成果展示 二甲雙胍散點圖: ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118215005409-1631156533.png)




- 站立會議合照 ![](https://img2020.cnblogs.com/blog/1925087/202111/1925087-20211118210202945-1488178234.png)




- 會議耗時記錄(每次追加記錄)
|第N次alpha會議| 耗時(分鐘)| | -- | -- | |1/6|8| |2/6|10| |3/6| 12| |4/6| 10| |5/6|9 | |6/6| 13|