1. 程式人生 > 其它 >【轉發】萬字使用者畫像標籤體系建設分析指南!

【轉發】萬字使用者畫像標籤體系建設分析指南!

轉發連結:https://www.cnblogs.com/purple5252/p/15631665.html

01什麼是使用者畫像使用者畫像是指根據使用者的屬性、使用者偏好、生活習慣、使用者行為等資訊而抽象出來的標籤化使用者模型。通俗說就是給使用者打標籤,而標籤是通過對使用者資訊分析而來的高度精煉的特徵標識。通過打標籤可以利用一些高度概括、容易理解的特徵來描述使用者,可以讓人更容易理解使用者,並且可以方便計算機處理。

使用者畫像是對現實世界中使用者的建模,使用者畫像應該包含目標,方式,組織,標準,驗證這5個方面。目標:指的是描述人,認識人,瞭解人,理解人。方式:又分為非形式化手段,如使用文字、語言、影象、視訊等方式描述人;形式化手段,即使用資料的方式來刻畫人物的畫像。組織:指的是結構化、非結構化的組織形式。標準:指的是使用常識、共識、知識體系的漸進過程來刻畫人物,認識瞭解使用者。驗證:依據側重說明了使用者畫像應該來源事實、經得起推理和檢驗。

在產品早期和發展期,會較多地藉助使用者畫像,幫助產品人員理解使用者的需求,想象使用者使用的場景,產品設計從為所有人做產品變成為三四個人做產品,間接的降低複雜度。
使用者畫像使用的標籤是網路標籤的一種深化應用方式,是某一種使用者特徵的符號表示,是我們觀察、認識和描述使用者的一個角度,使用者標籤是基於使用者的特徵資料、行為資料和消費資料進行統計計算得到的,包含了使用者的各個維度。而所謂的使用者畫像就是可以用使用者標籤的集合來表示的,作為一種勾畫目標使用者、聯絡使用者訴求與設計方向的有效工具。
使用者畫像,即使用者資訊標籤化,就是企業通過收集與分析消費者社會屬性、生活習慣、消費行為等主要資訊的資料之後,完美地抽象出一個使用者的商業全貌作是企業應用大資料技術的基本方式。使用者畫像為企業提供了足夠的資訊基礎,能夠幫助企業快速找到精準使用者群體以及使用者需求等更為廣泛的反饋資訊。

02使用者標籤的分類

1、按照標籤的變化頻率,可分為靜態標籤和動態標籤。靜態標籤是指使用者與生俱來的屬性資訊,或者是很少發生變化的資訊,比如使用者的姓名、性別、出身日期,又例如使用者學歷、職業等,雖然有可能發生變動,但這個變動頻率是相對比較低或者很少發生變化的。動態標籤是指非常經常發生變動的、非常不穩定的特徵和行為,例如“一段時間內經常去的商場、購買的商品品類”這類的標籤的變動可能是按天,甚至是按小時計算的。2、按照標籤的指代和評估指標的不同,可分為定性標籤和定量標籤。定性標籤指不能直接量化而需通過其他途徑實現量化的標籤,其標籤的值是用文字來描述的,例如“使用者愛好的運動”為“跑步、游泳”,“使用者的在職狀態”為“未婚”等。定量標籤指可以準確數量定義、精確衡量並能設定量化指標的標籤,其標籤的值是常用數值或數值範圍來描述的。定量標籤並不能直觀的說明使用者的某種特性,但是我們可以通過對大量使用者的數值進行統計比較後,得到某些資訊。例如“使用者的年齡結構”為“20-25歲”、“單次購買平均金額”為“300元”,“購買的總金額”為“20萬元”……,當我們獲得以上資訊是否就可以將該使用者劃分為高價值客戶呢?3、按照標籤的來源渠道和生成方式不同,可以分為基礎標籤、業務標籤、智慧標籤。

基礎標籤主要是指對使用者基礎特徵的描述,比如:姓名、性別、年齡、身高、體重等。業務標籤是在基礎標籤之上依據相關業務的業務經驗並結合統計方法生成的標籤,比如:使用者忠誠度、使用者購買力等標籤就是根據使用者的登入次數、線上時間、單位時間活躍次數、購買次數、單次購買金額、總購買金額等指標計算出來的。業務標籤可以將經營固化為知識,為更多的人使用。智慧標籤是利用人工智慧技術基於機器學習演算法,通過大量的資料計算而實現的自動化、推薦式的進行打標籤,比如今日頭條的推薦引擎就是通過智慧標籤體系給使用者推送其感興趣的內容的。4、按照標籤體系分級分層的方式,可以分為一級標籤、二級標籤、三級標籤等,每一個層級的標籤相當於一個業務維度的切面。在標籤應用中按照不同的業務場景進行標籤組合,形成相應使用者畫像。

5、按照資料提取和處理的維度,可以將標籤分為事實標籤,模型標籤,預測標籤。這種使用者標籤的分類方式更多是面向技術人員使用,幫助他們設計合理的資料處理單元。事實標籤。既定事實,直接從原始資料中提取,描述使用者的自然屬性、產品屬性、消費屬性等,事實標籤其本身不需要模型與演算法,實現簡單,但規模需要不斷基於業務補充與豐富,比如:姓名、購買的產品品類、所在小區等。模型標籤。對使用者屬性及行為等屬性的抽象和聚類,通過剖析使用者的基礎資料為使用者貼上相應的總結概括性標籤及指數,標籤代表使用者的興趣、偏好、需求等,指數代表使用者的興趣程度、需求程度、購買概率等。預測標籤。參考已有事實資料,基於使用者的屬性、行為、位置和特徵,通過機器學習、深度學習以及神經網路等演算法進行使用者行為預測,針對這些行為預測配合營銷策略、規則進行打標籤,實現營銷適時、適機、適景推送給使用者。例如試用了某產品A後預測可能還想買產品B並推送購買連結給該使用者。

03使用者畫像標籤體系的建立

1、什麼是標籤體系
使用者畫像是對現實使用者做的一個數學模型,在整個數學模型中,核心是怎麼描述業務知識體系,而這個業務知識體系就是本體論,本體論很複雜,我們找到一個特別樸素的實現,就是標籤。標籤是某一種使用者特徵的符號表示。是一種內容組織方式,是一種關聯性很強的關鍵字,能方便的幫助我們找到合適的內容及內容分類。(注:簡單說,就是你把使用者分到多少個類別裡面去,這些類是什麼,彼此之間有什麼關係,就構成了標籤體系)標籤解決的是描述(或命名)問題,但在實際應用中,還需要解決資料之間的關聯,所以通常將標籤作為一個體系來設計,以解決資料之間的關聯問題。一般來說,將能關聯到具體使用者資料的標籤,稱為葉子標籤。對葉子標籤進行分類彙總的標籤,稱為父標籤。父標籤和葉子標籤共同構成標籤體系,但兩者是相對概念。例如:下表中,地市、型號在標籤體系中相對於省份、品牌,是葉子標籤。

使用者畫像標籤體系建立後一般要包含以下幾個方面的內容

(1)標籤分類使用者畫像標籤可以分為基礎屬性標籤和行為屬性標籤。

由於基於一個目標的畫像,其標籤是在動態擴充套件的,所以其標籤體系也沒有統一的模板,在大分類上,與自身的業務特徵有很大的關聯,在整體思路上可以從橫縱兩個維度展開思考:橫向是產品內資料和產品外資料,縱向是線上資料和線下資料。而正中間則是永恆不變的“人物基礎屬性”。如果說其他的分類因企業特徵而定,那麼只有人物特徵屬性(至於名字叫什麼不重要,關鍵是內涵)是各家企業不能缺失的板塊。所謂人物基礎屬性指的是:使用者客觀的屬性而非使用者自我表達的屬性,也就是描述使用者真實人口屬性的標籤。所謂非“自我表達”,舉例來說,某產品內個人資訊有性別一項,使用者填寫為“女”,而通過使用者上傳的身份證號,以及使用者照片,使用者購買的產品,甚至使用者打來的客服電話,都發現該使用者性別是“男性”。那麼在人物基礎屬性中的性別,應該標識的是“男性”,但是使用者資訊標籤部分,自我描述的性別則可能標註為女性。(2)標籤級別(標籤的體系結構)分級有兩個層面的含義,其一是:指標到最低層級的涵蓋的層級;其二是指:指標的運算層級。其一非常好理解,這裡重點說運算層級。標籤從運算層級角度可以分為三層:事實標籤、模型標籤、預測標籤。事實標籤:是通過對於原始資料庫的資料進行統計分析而來的,比如使用者投訴次數,是基於使用者一段時間內實際投訴的行為做的統計。模型標籤:模型標籤是以事實標籤為基礎,通過構建事實標籤與業務問題之間的模型,進行模型分析得到。比如,結合使用者實際投訴次數、使用者購買品類、使用者支付的金額等,進行使用者投訴傾向型別的識別,方便客服進行分類處理。預測標籤:則是在模型的基礎上做預測,比如針對投訴傾向型別結構的變化,預測平臺輿情風險指數。

(3)標籤命名&賦值我們用一張圖來說明一下命名和賦值的差別,只要在構建使用者標籤的過程種,有意識的區別標籤命名和賦值足矣,不再贅述。

(4)標籤屬性標籤屬性可以理解為針對標籤進行的再標註,這一環節的工作主要目的是幫助內部理解標籤賦值的來源,進而理解指標的含義。如圖所示,可以總結為5種來源:1、固有屬性:是指這些指標的賦值體現的是使用者生而有之或者事實存在的,不以外界條件或者自身認知的改變而改變的屬性。比如:性別、年齡、是否生育等。2、推導屬性:由其他屬性推導而來的屬性,比如星座,我們可以通過使用者的生日推導,比如使用者的品類偏好,則可以通過日常購買來推導。3、行為屬性:產品內外實際發生的行為被記錄後形成的賦值,比如使用者的登陸時間,頁面停留時長等。4、態度屬性:使用者自我表達的態度和意願。比如說我們通過一份問卷向用戶詢問一些問題,並形成標籤,如詢問使用者:是否願意結婚,是否喜歡某個品牌等。當然在大資料的需求背景下,利用問卷收集使用者標籤的方法效率顯得過低,更多的是利用產品中相關的模組做了使用者態度資訊收集。5、測試屬性:測試屬性是指來自使用者的態度表達,但並不是使用者直接表達的內容,而是通過分析使用者的表達,結構化處理後,得出的測試結論。比如,使用者填答了一系列的態度問卷,推匯出使用者的價值觀型別等。

值得注意的是,一種標籤的屬性可以是多重的,比如:個人星座這個標籤,既是固有屬性,也是推導屬性,它首先不以個人的意志為轉移,同時可以通過身份證號推導而來。即便你成功了建立使用者畫像的標籤體系,也不意味著你就開啟了使用者畫像的成功之路,因為有很大的可能是這些標籤根本無法獲得,或者說無法賦值。標籤無法賦值的原因有:資料無法採集(沒有有效的渠道和方法採集到準確的資料,比如使用者身份證號)、資料庫不能打通、建模失敗(預測指標無法獲得賦值)等等。2、標籤體系結構標籤體系可以歸納出如下的層級結構。

(1)原始輸入層主要指使用者的歷史資料資訊,如會員資訊、消費資訊、網路行為資訊。經過資料的清洗,從而達到使用者標籤體系的事實層。(2)事實層事實層是使用者資訊的準確描述層,其最重要的特點是,可以從使用者身上得到確定與肯定的驗證。如使用者的人口屬性、性別、年齡、籍貫、會員資訊等。(3)模型預測層通過利用統計建模,資料探勘、機器學習的思想,對事實層的資料進行分析利用,從而得到描述使用者更為深刻的資訊。如通過建模分析,可以對使用者的性別偏好進行預測,從而能對沒有收集到性別資料的新使用者進行預測。還可以通過建模與資料探勘,使用聚類、關聯思想,發現人群的聚集特徵。(4)營銷模型預測利用模型預測層結果,對不同使用者群體,相同需求的客戶,通過打標籤,建立營銷模型,從而分析使用者的活躍度、忠誠度、流失度、影響力等可以用來進行營銷的資料。(5)業務層業務層可以是展現層。它是業務邏輯的直接體現,如圖中所表示的,有車一族、有房一族等。3、標籤體系結構分類一般來說,設計一個標籤體系有3種思路,分別是:(1)結構化標籤體系;(2)半結構化標籤體系;(3)非結構化標籤體系。(1)結構化標籤體系簡單地說,就是標籤組織成比較規整的樹或森林,有明確的層級劃分和父子關係。結構化標籤體系看起來整潔,又比較好解釋,在面向品牌廣告井噴時比較好用。性別、年齡這類人口屬性標籤,是最典型的結構化體系。下圖就是Yahoo!受眾定向廣告平臺採用的結構化標籤體系。

(2)半結構化標籤體系在用於效果廣告時,標籤設計的靈活性大大提高了。標籤體系是不是規整,就不那麼重要了,只要有效果就行。在這種思路下,使用者標籤往往是在行業上呈現出一定的並列體系,而各行業內的標籤設計則以“逮住老鼠就是好貓”為最高指導原則,切不可拘泥於形式。下圖是Bluekai聚合多家資料形成的半結構化標籤體系。

(3)非結構化標籤體系非結構化,就是各個標籤就事論事,各自反應各自的使用者興趣,彼此之間並無層級關係,也很難組織成規整的樹狀結構。非結構化標籤的典型例子,是搜尋廣告裡用的關鍵詞。還有Facebook用的使用者興趣詞。4、使用者畫像標籤層級的建模方法使用者畫像的核心是標籤的建立,使用者畫像標籤建立的各個階段使用的模型和演算法如下圖所示。

原始資料層。對原始資料,我們主要使用文字挖掘的演算法進行分析如常見的TF-IDF、TopicModel主題模型、LDA 等演算法,主要是對原始資料的預處理和清洗,對使用者資料的匹配和標識。事實標籤層。通過文字挖掘的方法,我們從資料中儘可能多的提取事實資料資訊,如人口屬性資訊,使用者行為資訊,消費資訊等。其主要使用的演算法是分類和聚類。分類主要用於預測新使用者,資訊不全的使用者的資訊,對使用者進行預測分類。聚類主要用於分析挖掘出具有相同特徵的群體資訊,進行受眾細分,市場細分。對於文字的特徵資料,其主要使用相似度計算,如餘弦夾角,歐式距離等。模型標籤層。使用機器學習的方法,結合推薦演算法。模型標籤層完成對使用者的標籤建模與使用者標識。其主要可以採用的演算法有迴歸,決策樹,支援向量機等。通過建模分析,我們可以進一步挖掘出使用者的群體特徵和個性權重特徵,從而完善使用者的價值衡量,服務滿意度衡量等。預測層。也是標籤體系中的營銷模型預測層。這一層級利用預測演算法,如機器學習中的監督學習,計量經濟學中的迴歸預測,數學中的線性規劃等方法。實習對使用者的流失預測,忠實度預測,興趣程度預測等等,從而實現精準營銷,個性化和定製化服務。不同的標籤層級會考慮使用對其適用的建模方法,對一些具體的問題,有專門的文章對其進行研究。


05使用者畫像的應用場景
使用者畫像,即使用者資訊標籤化,是企業通過收集與分析消費者基本屬性、社會屬性、生活習慣、行為特徵等主要資訊的資料之後,抽象出使用者的商業全貌。大資料的發展讓各行各業都日益聚焦於怎樣利用大資料瞭解使用者需求,實現精準營銷,進而深入挖掘潛在的商業價值。不同的企業做使用者畫像有不同的戰略目的,廣告公司做使用者畫像是為精準廣告服務,電商做使用者畫像是為使用者購買更多商品,內容平臺做使用者畫像是推薦使用者更感興趣的內容提升流量再變現。企業對使用者的瞭解越多,就越容易為使用者提供所需產品和服務,從而提升使用者的粘性,提升企業盈利能力。

1、瞭解使用者不得不承認大資料正在改變著各行各業,以前瞭解使用者主要是通過使用者調研和訪談的形式,形式單一、資料收集不全、真假難辨。尤其是在產品使用者量擴大後,調研的效用降低,以不能滿足企業發展的要求。利用大資料技術,基於標籤體系構建使用者的360°畫像,從使用者的各個維度進行分析,瞭解使用者是誰,他們有什麼特徵,他們的興趣偏好,而這些資訊的研究是企業制定營銷策略、服務策略,提升使用者滿意度的重要依據。2、精準營銷要做到精準營銷,資料是最不可缺的存在。以資料為基礎,建立使用者畫像,利用標籤,讓系統進行智慧分組,獲得不同型別的目標使用者群,針對每一個群體策劃並推送針對性的營銷。精準化營銷具有極強的針對性,是企業和使用者之間點對點的互動。它不但可以讓營銷變得更加高效,也能為企業節約成本。3、產品創新在使用者需求為導向的產品研發中,企業通過獲取到的大量目標使用者資料,進行分析、處理、組合,初步搭建使用者畫像,做出使用者喜好、功能需求統計,從而設計製造更加符合使用者核心需求的新產品,為使用者提供更加良好的體驗和服務。4、渠道優化當前的零售企業的銷售渠道有多種,比如:自營門店、經銷商代理、電商平臺、電商APP等,每個渠道的使用者群體的消費能力、興趣偏好可能是不一樣的,通過使用者畫像可以讓合適的產品投放在合適的渠道投放,從而增加銷售量,這是目前零售行業慣用的方法。5、個性推薦眾所周知,今日頭條是個個性化的新聞推薦引擎,在今日頭條CEO張一鳴看來,演算法是《今日頭條》這款興趣推薦搜尋引擎應用的核心,這也是與傳統媒體最本質的區別,今日頭條之所以能夠非常懂使用者,精準推薦出使用者所喜好的新聞,完全得益於演算法,而正是精準推薦,使得今日頭條在短短兩年多的時間內擁有了2.2億使用者,每天有超過2000萬用戶在今日頭條上閱讀自己感興趣的文章。

06使用者畫像的分類
從畫像方法來說,可以分為定性畫像、定性+定量畫像、定量畫像

從應用角度來看,可以分為行為畫像、健康畫像、企業信用畫像、個人信用畫像、靜態產品畫像、旋轉裝置畫像、社會畫像和經濟畫像等。

07使用者畫像需要用到哪些資料一般來說,根據具體的業務內容,會有不同的資料,不同的業務目標,也會使用不同的資料。在網際網路領域,使用者畫像資料可以包括以下內容:(1)人口屬性:包括性別、年齡等人的基本資訊
(2)興趣特徵:瀏覽內容、收藏內容、閱讀諮詢、購買物品偏好等
(3)消費特徵:與消費相關的特徵
(4)位置特徵:使用者所處城市、所處居住區域、使用者移動軌跡等
(5)裝置屬性:使用的終端特徵等
(6)行為資料:訪問時間、瀏覽路徑等使用者在網站的行為日誌資料
(7)社交資料:使用者社交相關資料

使用者畫像資料來源廣泛,這些資料是全方位瞭解使用者的基礎,這裡以Qunar的畫像為例,其畫像資料主要維度如下所示,包括使用者RFM資訊、航線資訊等。

Qunar的畫像資料倉庫構建都是基於Qunar基礎資料倉庫構建,然後按照維度進行劃分。

08使用者畫像的作用

在網際網路、電商領域使用者畫像常用來作為精準營銷、推薦系統的基礎性工作,其作用總體包括:

(1)精準營銷:根據歷史使用者特徵,分析產品的潛在使用者和使用者的潛在需求,針對特定群體,利用簡訊、郵件等方式進行營銷。
(2)使用者統計:根據使用者的屬性、行為特徵對使用者進行分類後,統計不同特徵下的使用者數量、分佈;分析不同使用者畫像群體的分佈特徵。
(3)資料探勘:以使用者畫像為基礎構建推薦系統、搜尋引擎、廣告投放系統,提升服務精準度。
(4)服務產品:對產品進行使用者畫像,對產品進行受眾分析,更透徹地理解使用者使用產品的心理動機和行為習慣,完善產品運營,提升服務質量。
(5)行業報告&使用者研究:通過使用者畫像分析可以瞭解行業動態,比如人群消費習慣、消費偏好分析、不同地域品類消費差異分析根據使用者畫像的作用可以看出,使用者畫像的使用場景較多,使用者畫像可以用來挖掘使用者興趣、偏好、人口統計學特徵,主要目的是提升營銷精準度、推薦匹配度,終極目的是提升產品服務,起到提升企業利潤。使用者畫像適合於各個產品週期:從新使用者的引流到潛在使用者的挖掘、從老使用者的培養到流失使用者的迴流等。

總結來說,使用者畫像必須從實際業務場景出發,解決實際的業務問題,之所以進行使用者畫像,要麼是獲取新使用者,要麼是提升使用者體驗、或者挽回流失使用者等具有明確的業務目標。

另外關於使用者畫像資料維度的問題,並不是說資料維度越豐富越好,總之,畫像維度的設計同樣需要緊跟業務實際情況進行開展。

09使用者畫像的體系架構
按照應用系統分層設計的原則,基於標籤體系的使用者畫像的體系結構可以分為:資料來源層、資料採集層、資料建模層、資料應用層,行業應用層等。

資料來源層:使用者標籤體系建設的需要從不同的來源彙集資料,例如,企業的核心繫統(不同的行業其核心繫統不同,對製造業來說核心系統有ERP、MES、PLM等),營銷系統(CRM),網際網路資料(電商平臺以及微信、微博、論壇等社交平臺獲取的資料),以及從第三方專業機構獲取的資料(各地的資料交易中心購買的資料)。資料採集層:與傳統資料專案的資料採集不同,基於標籤體系的使用者畫像的資料來源廣泛、資料量巨大,資料型別豐富(包括:結構化資料、半結構化資料和非結構化資料),有線上的使用者行為資料,也有應用系統日誌資料,有網際網路爬蟲資料,也有API介面的第三方資料包。使用者畫像資料採集需要通過網路爬蟲或網站公開API等方式從網站上獲取資料資訊,並且可以將非結構化資料從網頁中抽取出來,將其儲存為統一的本地資料檔案,並支援以結構化的方式儲存。同時支援圖片、音訊、視訊等檔案或附件的採集,附件與正文可以自動關聯。資料建模:基於標籤體系的使用者畫像建模主要是針對使用者畫像的建模和產品的建模。產品畫像建模包括了資料清洗、文字建模、類別識別、品牌識別、屬性識別、產品畫像等;使用者畫像建模包括了資料清洗、使用者全渠道ID識別、資訊整合、分析建模和使用者畫像。通過統一產品類目和屬性體系和統一的使用者畫像標籤體系的建設,為使用者標籤的應用提供支撐。資料應用:即基於標籤體系的應用,包括分析類應用(如使用者分析、產品分析)、服務類應用(如服務及產品創新)、營銷類應用(精準營銷)、資料介面API等。行業應用:基於標籤體系的使用者畫像在各行業的所應用和探索,將為行業的發展和創新帶來更多可能。行業應用:基於標籤體系的使用者畫像在各行業的所應用和探索,將為行業的發展和創新帶來更多可能。

10使用者畫像的建設步驟

1、資料採集使用者畫像是根據使用者的人口資訊、社交關係、偏好習慣和消費行為等資訊而抽象出來的標籤化畫像,使用者畫像資料來源多樣,採集方式也不同:線下采集、線上採集、第三方介面等。2、資料清洗要實現精準的使用者畫像就需要對這些噪聲資料、髒資料進行處理,這個過程我們叫做資料清洗。3、資料標準化資料標準化的方法有很多種,常用的有“最小—最大標準化”、“Z-score標準化”和“按小數定標標準化”等。經過上述標準化處理,原始資料均轉換為無量綱化指標測評值,即各指標值都處於同一個數量級別上,可以進行綜合測評分析。4、資料建模資料建模就是根據使用者行為,構建模型產出標籤、權重。一個事件模型包括:時間、地點、人物三個要素。每一次使用者行為本質上是一次隨機事件,可以詳細描述為:什麼使用者,在什麼時間,什麼地點,做了什麼事。使用者動態建模公式:使用者標識 +時間 + 行為型別 + 接觸點(網址+內容),表示某使用者在什麼時間、地點、做 了什麼事,所以會打上某標籤。使用者標籤的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為型別,同時該標籤對該使用者的重要程度也決定了使用者標籤的權重,進一步轉換為公式:使用者標籤權重 = 行為型別權重 × 時間衰減 × 使用者行為次數 × TF-IDF計算標籤權重

行為型別權重:使用者瀏覽、搜尋、收藏、下單、購買等不同行為對使用者而言有著不同的重要性(偏序關係),該權重值一般由運營人員或業務來決定;時間衰減:使用者某些行為受時間影響不斷減弱,行為時間距現在越遠,該行為對使用者當前來說的意義越小,採用牛頓冷卻定律;行為次數:使用者標籤權重按天統計,使用者某天與該標籤產生的行為次數越多,該標籤對使用者的影響越大。公式:t=初始溫度×exp(-冷卻係數×間隔的時間),實際應用中,初始溫度為1就行,間隔的時間為今天與產生行為那天的天數,或者小時數都行,根據業務進行調整,冷卻係數的業務來決定,或者通過資料分析而來。TF-IDF計算標籤權重:tf為某標籤在該使用者出現頻率,idf為某標籤在全部標籤中的稀缺程度。5、標籤挖掘標籤挖掘,即對使用者標籤體系中的使用者資料進行挖掘,形成使用者標籤,這個過程也叫標籤生產。標籤的生產方式主要有以下兩種:①基於規則定義的標籤生產方式,即根據固定的規則,通過資料查詢的結果生產標籤,重點在於如何制定規則。②基於主題模型的標籤生產方式,主題模型最開始運用於內容領域,目的是找到使用者的偏好,在使用者標籤中我們可以參照分類演算法將使用者進行分類、聚類,使用關鍵詞的演算法挖掘使用者的偏好,從而生產標籤。6、資料視覺化資料視覺化是基於標籤體系的使用者畫像的重要應用, 通過詳實、準確對使用者的各類標籤資料進行彙集和分析,並以圖片、表格等視覺化手段幫助企業全面瞭解使用者的基礎資訊,使用者關係情況,使用者經濟情況、使用者偏好情況、健康情況、飲食情況等資訊。同時,利用資料標籤體系的使用者畫像視覺化技術,通過對使用者關係資料、使用者內容資料、使用者行為等資料進行視覺化展示,能夠幫助企業管理人員、業務人員全面瞭解使用者,瞭解使用者是誰,他們有什麼特徵,他們的興趣偏好等,從而為智慧推薦、精準營銷、產品和服務創新、渠道優化等業務提供支撐。