1. 程式人生 > 實用技巧 >學習總結(二)

學習總結(二)

小小的學習總結(內容比較雜亂。。)

- excel資料匹配(vlookup)
①VLOOKUP(B339,大類名稱!A44:C91,2,FALSE):
往下拖時易出錯
②VLOOKUP(B339,大類名稱!A$44:C$91,2,FALSE):
正解(觀察第二個引數)
不能保證完全正確:我的匹配資料有2.7萬條,每次拖時只能顯示一頁,後面的都不能正確顯示。但,利用此方法,加上微微調整,很快整理好了。(然後我著急忙慌去上體育課,測800。現在是晚上六點半,剛歇好,希望明天腰不酸腿不疼!----大學生的卑微日常)
- 關聯規則
對於超市資料,老師給出了四張表:品牌表、兩張商品分類表、2.7萬條銷售流水資料。裡面的資訊給的很全面,價格、數量、編碼、規格等等。資料很全面,我想說的是,如果你要做關聯規則,那就要時刻記住自己的目標,只挑自己需要的資料!(需要刪很多資料的,用到的並不多,而且要觀察資料裡面的邏輯,就像商品類別,裡面大類、中類、小類都混在一起。如果做關聯規則的話,很不現實,也比較難找,具體一點就是:小類有1千多種,你就要有1千多個列,看到這裡我就想放棄了。。。。一方面,1千多個列放不到表裡;另一方面,即便你放進去了,你找到買旺仔牛奶的顧客會買山萃水果堅果混合麥片,的規則也不現實,太過於細緻了,比較正常的是:買牛奶的可會很大程度上會買麥片。我想說的是往大類上湊,大類有48類,其實也不算少,但要做的話,也是可以的;中類的就不要想了380多種。)

還有一點,既然我們是要仿照啤酒尿布的挖掘案例,那麼商品是什麼牌子的就可以不用關注了,其實想想大類,就知道,商品的牌子可以完全忽略,所以,我們只剩下三張表了。(其實,老師給了三個門店的銷售流失資料,三張表,每張大概8千多條流水資料,我是想合在一起的。第一次,我在excel裡面複製貼上,然後excel就卡了…它卡了,我急了,也心累了。後來我把三張表放到資料庫裡面,兩條語句就插到裡面了,巨快。但在匯出的過程遇到了問題。下一條再詳細說。)

- sql server 匯入、匯出excel資料(.xlsx)
我之前下載的是2012的sql server,奈何裡面的VS不能用,讓我下載各種元件,我硬著頭皮以依次載好,並除錯。終於正常與資料庫建立起連線,但致命的是無法進行佈署,這次順著報錯訊息,也沒能找到好的解決辦法。所以我全部刪了…重新下載了,下載的是sql server2008 R2,雖它版本比較老,頁面不夠炫酷,比較醜,但真的好用(不算是好用吧,應該是能用,我已很滿足),全套的,我愛了。

回到正題,上面提到sql server2008 R2版本比較老,如果,你匯入或者匯出的資料涉及到.xlsx(新版)字尾名的工作簿會出現問題,在資料庫裡面不會直接反應,在你開啟excel是會報錯,如果你仔細看報錯資訊,會發現老版的sql server匯出的是.xls(老版)字尾名的工作簿,而老版的最多自能有6000多條資料。
你可能要問,那怎麼不修改一下,匯出為2007的、新版的?但會報錯的,也就是老版sql server不支援。你下載一個外掛就可以(是關於office的外掛,我的電腦是64位的,網上有個解決此問題寫的很好的帖子,寫的很詳細,我也按上面的走了一遍,在資料庫裡面點了點,看了看,好像沒成功。直接上簡單粗暴的方法吧,不用看資料庫裡面的啥啥啥,直接下外掛,下載的版本匹配了就可以直接匯入匯出!)我不才,放不上安裝包。。。。
大概長這個樣子(千萬別找我要,我把安裝包刪了…):
在這裡插入圖片描述
下載好是這個樣子:
在這裡插入圖片描述
(這麼簡單的問題,我怎麼巴拉巴拉說了這麼長)

  • sql server 資料庫關係圖
    我在設定表與表之間的內外來鍵時,不能儲存,就報錯,具體的報錯資訊我忘了,當時看到個帖子,修改一個地方就可以,原理我沒看…
    如果遇到這個問題就試試這個解決方法:
    把紅框裡面的“是”該為否(我不知道改了之後會出現什麼問題,還是有點顧慮的,應該我預處理沒有做好,我也不知道。其實我的作業不用做主外來鍵,應該是做資料匹配,並整理成01矩陣。這是我第一次嘗試中遇到的問題)
    在這裡插入圖片描述
  • Python資料匹配–01矩陣
    這個是我最後一步要完成的任務,但我現在還沒有思路,應該是要用到Python語句的,因為它快!好了,我要去查了