1. 程式人生 > 其它 >如何避免成為一臺取數機器?

如何避免成為一臺取數機器?

取數是資料工作的一個基礎內容,也是大多數“入門”級別資料工作人員(例如資料分析師)的基本職責,取數對於前期的資料概況和業務需求會是一個熟悉和漸進了解的過程,因此這個過程必不可少,特別是對於剛入職的新人。

但是,如果一個數據工作者長期從事取數工作(例如超過2年,這裡的時間取決於企業的資料規模和複雜度),那麼其價值確實會很小,為什麼這麼講呢?

這裡,首先要談談取數這個工種的特點,就八個字:上不著天,下不著地。

在企業內取數的目的無外乎兩個:決策分析(比如各類統計等)和使用者營銷,取數人員對下銜接了平臺和資料,對上銜接了業務人員,似乎是最容易成為複合型人才的,但大多時候不是這樣。

實際情況是,取數人員號稱需要理解業務,但由於不為業務發展負責,因此其不需要鑽研業務,而通過取數獲得的直觀業務理解是非常有限的。

舉個例子,業務人員需要取某個特定口徑營銷活動的目標使用者,取數人員當然可以方便的取出來,但很少有取數人員能真正的去理解取數的背景,當然可能人家也不給這個機會,比如營銷活動的目的是什麼、為什麼定這個業務口徑、採用什麼樣的營銷政策、準備怎麼觸達這些使用者等等。

從技術的角度看,取數人員雖然要接觸平臺和資料,但由於只取不改,因此技術要求其實很低,一般掌握簡單的SQL就可以了,但這降低了取數人員技術進步的可能,現在很多取數工具視覺化做得不錯,取數人員甚至連後臺的基本命令都不需要掌握。

因此,取數人員的實際技術含量是很低的。

但由於取數速度又往往影響企業的決策和營銷效率,因此取數人員在企業內非常被需要,有些取數人員自我感覺還不錯,但由於這個工種本身的特點,決定了職業天花板很低。

更不好的訊息是,在一個企業內,IT部門一般就是後端部門了,資料部門則是IT部門的後端,而取數又是資料部門的末端,取數特別上不了檯面,上不了檯面意思就是取數太強調過程了,沒法體現真正的業務或技術貢獻,部門或公司不需要取數人員做彙報,其業績往往只是部門老大PPT上的一個數字,1000和10000對取數來說可能是雲泥之別,但對於其它人的意義就是一個變動的數字。

如果你現在已經從事取數工作1年以上了,但被業務部門日常、瑣碎的取數需求佔據大部分時間,每天忙到懷疑人生,你就要想想,自己是否已經成為了一臺取數機器。

一些取數人員覺得會不服氣,自己倖幸苦苦,加班加點取出那麼多資料,業務人員EXCEL、PPT倒騰幾下就出了結論,自己則沒半點功勞,憑什麼?

那你得好好想想蘋果手機的價值鏈,最有價值的是設計,從來不是富士康,前者具有稀缺性,後者換誰做都可以,這就是現實。

這是很多取數人員在一個企業內面臨的基本面。

我這麼提,並不是說取數是一個沒有前途的工種,而只是表明,一些工種天然跟業務,領導聯絡緊密,很容易被關注,能獲得更多的反饋,也容易獲得進步,潛力不容易被埋沒,而很多工種則相反,特別強調自省,否則一不小心就成了大叔,泯然眾人矣,類似的其實很多,比如一些維護和客服工作。

那麼,取數如何自省?

首先要說明,從來沒有人明確定義過有取數這個工種,也沒有人限定過取數的邊界,你去招聘網站上看,只能看到資料建模,資料分析,資料架構,經營分析,資料開發,資料管理等這類崗位,但基本沒有取數。

取數實際是上述崗位需要掌握的一個基本功,取數本身只是手段,其內涵很難成就一個職業,企業裡現實情況是,一方面很多取數人員沒認真思考過職業規劃,比如取數了一年還沒點想法,另一方面企業可能也缺乏資料人才培養的環境,沒能力照顧到每個員工的發展,往往是走一步看一步,現在外行領導內行的情況蠻多的,外行可以搞搞無為而治,但要說培養專業人才,必須對於這個專業有深入的理解。

假如你已經意識到了這個困境,希望有所改變,下面的建議,一定要看完:

1、理解什麼叫真會取數

取數是理解資料和業務最有效的手段,如果你是個新人,先老老實實的去實踐吧,即使已經有什麼資料分析師,資料建模師等的職業理想也先藏在心裡,這個過程一般在半年到一年,當然各類企業由於業務和資料環境的不同有差異,等到你成為合格的取數人員了,你再繼續往下看。

那麼什麼叫做合格的取數人員?

(1)在你所取數的領域,業務人員一開口,你就基本知道怎麼取了,完全不依賴它人,這需要反覆的練習,形成自己的取數套路,如果你經常跟業務人員扯皮,或者返工很多,或者外部評價一般,就要想想是否是自己學藝不精,而不是人家跟你過不去,如果你取數到一定水平,會形成一定的取數權威,業務人員會信任你。

(2)面對業務人員能獨當一面並不意味著你已經是合格的取數人員,很多企業寬表做的很好,能夠應付大多數的取數,建議你至少要知道你這條業務線的取數涉及的所有基礎表的來龍去脈,這需要自頂向下的學習,無法靠簡單的自底向上的日常實踐就能獲得,你要儘量擴充你的資料視野,千萬不要被幾張寬表困在局中,否則你完全不知道如何變通,寬表成就不了資料分析,資料建模等事業。

如果你覺得夠格了,那可以繼續往下看,如果現在連取數都還疙疙瘩瘩,那就別好高騖遠,先認認真真,老老實實的做好了再說。

2、業務上要更進一步

在我看來,基於業務人員想法來取好數,最多隻是"60分工作",即便你的需求來源是業務部門老總,也就值60分。何為"60分工作"?就是剛剛滿足溫飽的工作,讓你能賺這份工資,但無法凸顯你的價值。

如果你的職業規劃偏向業務,比如成為經營分析師或者資料分析師,你就需要通過取數過程主動表現出你對於業務的認識和貢獻,如果你還不知道什麼叫作主動體現想法,以下是兩個場景:

(1)主動提供取數建議:有大量的取數是有一定難度的,業務部門往往事先沒想清楚,這個時候就需要當面溝通,要抓住機會主動提供一些建議,與業務人員互動也是理解業務需求和分析思路的好機會,要善於換位思考,最好將取數的主動權抓在自己手裡,引導業務人員按你的想法去做,不僅讓人家覺得你這人靠譜,而且可以降低大量無效的取數,要知道,業務人員越想不清楚的需求,就越容易亂提,然後雙方就在口徑上糾纏不清,取數人員經常埋怨業務部門新人亂提需求,不懂基本的規則,就是這個原因。

在與業務部門互動的過程中,你的取數能力、業務能力、思考能力、溝通能力及表達能力都能獲得很好的鍛鍊和展現,這種取數人員很容易被業務部門盯上,然後某天就去業務部門報道了,當然並不是說一定要走這條路,但這樣做的確讓自己的人生多了一種選擇,畢竟不是每個取數人員都適合去做技術。

(2)主動參與一些分析:一般認為,業務分析是業務部門的事情,資料部門很少參與,但實際情況並不是這樣,取數人員照樣有分析鍛鍊的機會,比如KPI指標異動,往往需要先確保原始資料準確,然後再從業務上查詢問題,這個時候業務人員和資料人員的分工介面其實不是很清楚,大家都可以做,由於取數人員最先拿到資料,因此有條件先人一步。

公司也不關注到底哪個部門應該提供分析報告,而在於哪個部門能更快更好的通過分析發現和解決問題,因此偏系統層面的欠費分析,稽核分析等等,資料部門做往往更有優勢。

在做資料分析的過程中,取數人員會養成深度思考的習慣,掌握基本的分析和表達技巧,煉成一種通過資料講故事的能力,不僅提升了綜合能力,而且能較好的彰顯自身的價值,價效比是很高的,根據觀察,能通過取數開啟一片天空的,很多有資料分析的經驗。

因此,取數人員不僅要扮演好"實現者"的角色,更要能成為"思考者",分析則是取數人員實現突破的康莊大道。

3、技術提升的空間很大

如果你還是想做技術,那技術空間可大著,關鍵在於要有改變的意識,不要總是按部就班,其實取數過程中接觸的任何現成平臺、工具與資料都有改進的機會,關鍵在於你敢不敢去優化,甚至顛覆它們,以下是一些場景:

(1)讓模型變得更好用:資料倉庫模型本來的目的是降低取數的成本,但隨著業務發展、系統變更及取數複雜性的增大,可用性會越來越差,很多取數人員就沒有這個意識去改變下,比如增加幾個欄位,甚至自己建個模型表,別以為現成的模型師就比你做得好。如果你以後想成為一個數據架構師,可以從做資料倉庫模型優化開始,敢於動底層的程式碼,在這個過程中能搞清楚一系列的概念,比如ETL,DW,OLAP等等,要敢於去做一些長遠的事,取數的經驗通過模型沉澱下來後可以讓取數跑得更快,你的優化將讓全團隊受益,這就是顯性化價值,如果你想改變,這就是一個切入點。

(2)讓平臺變得更好用:在做資料倉庫的時候,為了讓資料跑得更快,你需要接觸到大量的技術,評估各類技術的優劣,現在大資料平臺hadoop,MPP,流處理是為了滿足不同的大資料處理場景需要而產生的,你甚至可以自己來搭建平臺,從資料處理者轉變為平臺架構師,這又是一條成長路徑,當然你要提前做好準備,比如多找些開源工具練手,或者自己搭一個取數環境,真有機會才能抓得住。

(3)讓產品變得更好用:假如你發現很多取數能夠固化成報表,應該當仁不讓的寫指令碼並實現它,假如你所在的企業提供了取數工具,你恰好對產品感興趣,就可以結合取數的實踐,思考下這個工具有什麼問題,有哪些需要改進的地方,做資料產品經理不是你想做就能做得,你得首先體現出做產品的素質,敢於提出建議並給出設計,這就是一個好的開始,團隊少一個取數人員損失不大,多一個有想法的做開發和產品的人,那是可遇而不可求的事情。

(4)讓資料變得更有用:如果你對資料探勘感興趣,那就不要僅限於只會SQL,起碼要把Python,R等語言學會,能夠端到端的完成一個數據挖掘過程,一般資料團隊總是有相關的專業課題的,機會一到,一定要主動請纓,在做這類具有挑戰性的課題中,你的能力會快速增長,也就實現了華麗轉身。

總之,取數人員如果要做技術,就要想清楚自己要什麼,然後讓領導看到你在這方面的努力和變化。

4、從授人以魚到授人以漁

由於市場變化很快,取數總是滯後於市場,同時企業的取數流程帶來的管理開銷是巨大的,無論是溝通成本,審批成本或是反覆成本,實際上取數永遠無法讓業務人員滿意,最好的方式是讓業務部門自己來取,這是最高效率的做法,但這種模式能否執行也依賴於企業的實際情況。

假如業務部門真的願意自己來取(一般競爭越激烈的企業驅動力越強)也不是那麼容易,至少取數人員要配合做到以下幾點:

(1)提供平臺或工具:如果沒有適當的工具,讓非技術人員寫SQL(姑且認為分析師是技術吧),可能普通業務會排斥,此時需要給他們提供一個介面化、可點選、可拖拽的工具。這種系統如果只是簡單的基於底層資料來開發不難,無非是將使用者介面的點選和篩選條件,對映到後臺的sql“模板”,並生成一個sql語句然後再去資料庫執行,這種方法往往比較容易接受且非常靈活。

(2)提供適當的培訓:各業務線學員自己要能獲取資料,要給業務線的其中一個經常運用到資料的人員進行培訓,對每個部門種下一名種子選手,當這名選手學會之後,他有個任務就是把技能擴散到部門中的各個人員。

(3)普及資料文化:由於人員培養是個長期過程,因此需要協同公司的人力等部門,建立一套常態化的培訓機制,包括課程體系、師資隊伍等等,比如企業的大資料培訓計劃,當前每年開展的培訓次數超過4000人次。

如果你已經意識到這一點,可以嘗試著現在就提出這種思路,甚至簡單的去實現一個自助取數工具,說不定會獲得認可呢?即使推動不了業務部門用,自己用也可以,配置是絕對快過自己寫程式碼的,比如我們有隻7個人的取數團隊,手工+配置每天能做到30張單子,原來沒有配置能力前就只能做10幾個。

授人以漁這種支撐模式跟每個企業的發展階段有關係,其實你能做的大多時候只能是順勢而為,但要相信自助化是一個趨勢,不嘗試永遠沒有機會。

5、與業務人員做一定的博弈

博弈的目的不是為了推擋取數需求,而是因為取數這種事務性的工作,特別容易讓你陷入低質勤奮的狀態,取數人員需要為自己留出一定的時間來思考前面提出的系列問題,比如機器換人,大量的資源投入長遠來講實際還損害公司的利益,不少企業碩士或者博士都在長期取數,這是資源的浪費。

那麼,如何博弈?

(1)建立一套取數管理機制和流程,包括標準化的取數模板,嚴格的審批流程等等,雖然增加了取數門檻,但也會擋掉一些需求,給自己一些時間緩衝,否則很容易會被各種緊急需求淹沒。

(2)多問問業務人員取數的目的,別當老好人,你問得越多,業務人員提需求就會越謹慎,比如常問“你要這個資料幹什麼?“,對業務人員來說就是一種威懾,有可能資料需求連他們自己都沒想明白,這可以有效過濾掉不靠譜的、不尊重別人時間的需求。

(3)需求太多的時候可以跟業務人員協商,排定優先順序,暗示時間和資源有限,把時間放在高價值、最重要的地方。

我相信,你的上級所以一直讓你做取數,大多時候,是因為根本不知道你除了取數還能幹什麼,假如你的確按照以上的做了,發現企業仍然不能給你進一步提升的機會,你就要考慮是不是應該換個公司。