1. 程式人生 > >使用者畫像的定義、作用以及如何構建

使用者畫像的定義、作用以及如何構建

一、什麼是使用者畫像

關於使用者畫像的定義,不得不提的就是 Alan Cooper 提出的 persona 概念: 建立在一系列真實資料之上的目標使用者模型。通過使用者調研去了解使用者,根據他們的目標、行為和觀點的差異,將他們區分為不同的型別,然後每種型別中抽取出典型特徵,賦予名字、照片、一些人口統計學要素、場景等描述,就形成了一個人物原型。 其實使用者畫像就是為了方便我們具體地、標籤化地、有針對性地描述使用者特徵,並以此作為市場分析、商業決策、精準營銷的依據。 通常,我們對使用者進行標籤化之後會得到一些精準的描述,比如: 25歲左右的男性,本科學歷,網際網路工程師,長期定居一、二線城市,經常關注數碼產品,喜歡玩遊戲。 這就是一個超級簡單的使用者畫像,當然這個可以表示一個使用者,也可以用來描述一個群體。像這樣的標籤我們可以有很多型別: 性別
年齡 學歷 職業 收入 居住地 興趣愛好 瀏覽習慣 交際圈子 …… 當然這裡面的大部分標籤都是靜態的,也就是在一定的時間範圍內,幾乎是不會變化的,比如性別、年齡、學歷、職業、收入、居住地、興趣愛好等等,而像瀏覽習慣、使用者行為等等資訊則會在不同時間都產生不同的分佈。 靜態的標籤很多時候是通過使用者的註冊資訊直接獲得的,比如我們一般在註冊使用者資訊、填寫個人資料的時候都會填寫性別、出生年月、學歷、職業之類的資訊。 而動態標籤是一般是基於使用者真實的產品使用行為,對於一款產品,一個使用者(一類使用者)使用的頻率是怎麼樣的,他在使用哪些功能,時間是多少……從這些行為記錄資訊中,我們可以得到一些非標籤化,但非常具體且很有用的資料。

二、使用者畫像有什麼作用

在網際網路的早期,使用者畫像就是記錄一些使用者的基本資訊,多數都是通過使用者自己輸入的靜態資料。因為資料量和技術的限制,也沒有那麼多高大上的用法。 資料分析 資料量大了之後,對於平臺來說,如何去有效地定義使用者,高效地對使用者進行描述就成了一個問題。然後大家發現,打標籤是最有效的方式,打標籤的重要目的之一是為了讓人能夠理解並且方便計算機處理,如,可以做分類統計:來自一、二、三線城市的使用者分別有多少?喜歡籃球的有多少?單身有多少?有了這些標籤,就可以做一些基本的資料分析了。 產品定位 再設計商業專案或者新產品之前,我們都會對使用者和市場做一個系統的分析。我們的產品/服務面向的使用者是哪一個群體,年齡範圍是什麼?有無性別區分?收入水平是什麼樣的?對我們產品涉及的領域的消費觀念是怎麼樣?前期不論是粗獷的定位還是精細化地調研,其實都是在手動做這些打標籤、建立使用者畫像的動作。 精準推廣/使用者拉新
通過打標籤的這種形式,能夠讓平臺對使用者有基本的瞭解,知道哪部分人是自己的主流使用者。比如技能學習平臺,主流使用者是大學高年級學生以及初入職場的年輕人;比如運動內容平臺的主流使用者可能是16-30歲之間,一、二線城市的男性……有了這些使用者畫像之後,平臺可以精準地去尋找渠道,使廣告效益最大化。 個性化服務 使用者產生的資料越來越多,平臺提供的內容、服務也越來越多,如何針對不同使用者提供不同的內容,降低使用者篩選內容、服務的成本?這就是做資料探勘工作:喜歡運動的男性通常會購買哪些商品?經常關注數碼產品的人可以推薦哪些內容?A使用者和B使用者的標籤非常相似,A購買的哪些商品是可以推薦給B的?這就有點我們經常說的精細化運營和推薦系統的味道了。 大資料處理,離不開計算機的運算,標籤(使用者畫像)提供了一種便捷的方式,使得計算機能夠程式化處理與人相關的資訊,甚至通過演算法、模型能夠“理解” 人。當計算機具備這樣的能力後,無論是搜尋引擎、推薦引擎、廣告投放等各種應用領域,都將能進一步提升精準度,提高資訊獲取的效率。

三、如何建立使用者畫像

1.資料來源的準備與分析 對於現在的網際網路產品來說,基本上都是有現成的使用者資料,那其實需要做的事情就是將這些資料進行結構化和清洗,去除噪音和不規整的資料,為後續的建模做好準備。 那如果是產品為成型或者使用者量特別少怎麼辦呢?這個沒有特別好的辦法,資料仍然是一個重要的武器。當然有一些公開的資料,或者可以付費獲取的行業使用者資料也是可以利用的資源。也可以進行一些實際的使用者調研(可以外包),獲取使用者調研的資料。 如上所述,資料來源可以劃分為靜態資料和動態資料,這裡需要提一點的是,為了使用者畫像更好地建立,在建立使用者資訊的時候就要規劃好,也可以嘗試利用一些激勵機制來刺激使用者完善資訊。當然動態資料的埋點也要做好,頁面訪問、瀏覽行為、消費行為、點選行為等資料儘量完善,這樣在需要的時候可以獲得足夠的資料。 2.使用者分類 通過對使用者靜態資料的分析,可以進行基本的使用者分類,比如男、女使用者,城市分佈、年齡段劃分、使用者來源劃分、收入水平劃分、職業化分等。 靜態資料獲取後,需要對人群進行因子和聚類分析,不同的目的分類依據不同:如對於產品設計來說,按照使用動機或使用行為劃分是最為常見的方式,而對於營銷類媒體來說,依據消費形態來區分人群是最為直接的分類方式。 3.使用者標籤的定義與權重 有了靜態和動態的資料之後,我們就要為每個使用者打上標籤,以及該標籤的權重。 標籤,表徵了內容,使用者對該產品或者服務有興趣、偏好、需求等等。 權重,表徵了指數,使用者的興趣、偏好指數,也可能表徵使用者的需求度。 最後我們得到的最終標籤可能是: 小明:遊戲 0.8;運動 0.6;音樂 0.5;讀書 0.3…… 小王:遊戲 0.3;運動 0.3;音樂 0.8;讀書 0.5…… 聚聚:遊戲 0.1;運動 0.5;音樂 0.6;讀書0.8…… 權重如何來定義呢?其實這個需要一定的經驗,如果你對使用者或者行業大致情況比較瞭解,那麼可以通過經驗來進行定義。當然也可以請領域的專家來幫忙進行。 當然這個權重可能就不是一成不變的,每個使用者的階段性變化以及整個使用者市場的變化都是有可能對權重的定義產生影響,這個可以在後期不斷優化。 根據特徵值對群體進行定義,有助於一目瞭然掌握該群體的特性,如“時尚潮人”,“運動達人”可以快速的聯想到針對這類人,同時有利於具象化地去尋找這類潛在使用者。 4.資料建模 完成前面3個步驟,其實已經可以做很多落地的事情了,筆記使用者行為分析,廣告的精準投放,產品服務的更新迭代,簡單的內容推薦等等。 但是這個離精準推薦、精細化運營還有一些距離。如何根據使用者行為,來自動為使用者新增標籤、設定權重,如何通過使用者行為對不同使用者進行相似性衡量,如何通過相似性度量進行鍼對性的推薦,這些可能是使用者資料量達到一定規模之後需要考慮的事情。 目前比較常用的協同過濾的推薦思想,就是在對使用者的行為資料進行定量化分析和相似性度量之後,自出的自動化決策。 當然並不是只有推薦系統,精準化的分析和決策、個性化的管理、甚至自動化的運營都是建立在這個基礎之上。 當然,使用者畫像的事情,如何做,還是要根據自己的產品,和行業的經驗進行鍼對性地搭建,並在此基礎上根據運營情況迭代和優化,並沒有一個可以適用於任何產品的通用框架。當然別人的經驗是可以借鑑的,這也可以少走很多彎路,之前在DC學院看到過一個比較系統講解使用者畫像(包括如何篩選資料來源,定義、尋找特徵,通過聚類和分類的演算法進行預測和具體如何去實施)的小課,強烈推薦:基於使用者畫像的精準營銷