1. 程式人生 > 其它 >當開啟淘寶/抖音的那一刻,它就知道你想要的是什麼

當開啟淘寶/抖音的那一刻,它就知道你想要的是什麼

在當今人們的日常生活中,手機佔據了重要的角色。在大多數人的手機裡,已經裝滿了各種五花八門的手機應用,無時無刻不在想著瓜分我們的時間。

很多時候,我們驚奇的發現,手機上的應用越用越聰明,智慧手機真的越用越「智慧」了。沒刷多久的短視訊,就似乎已經掌握了我們的愛好和興趣,不斷的推送相關的視訊和內容;每次開啟淘寶,總能從一堆玲琅滿目的商品中推薦出自己心念念已久的好物;陪伴著我們無數個深夜的網抑雲,同樣也能推薦出一個又一個讓人迴圈不止的歌單。

似乎,這些應用總在不斷窺探著我們的內心,不斷著迎合著我們的興趣和喜好。那這到底是app真的越來越智慧了,還是說我們的隱私越來越不值錢了?

1

事實上,app獲得使用者習慣的方式很簡單。無非就是埋坑、打點、上報、餵養、預測

而已。

一款產品在更新迭代的過程中,除了需要前端、後端、客戶端以及測試這些我們比較熟知的角色外,還有一個角色對成熟的產品而言及其重要。每一個產品在功能需求層面上的決策,都離不開這種角色。

這就是所謂的資料分析師,俗稱DA(DATA Analysis)。資料分析師是一群專門跟資料打交道的人,他們最擅長的是將現象、狀態等通過定性描述的東西定量化。定了量,就有了資料。

然後從資料分析行為,從量級推倒趨勢,從置信區間決策功能邏輯。聽起來怪神奇的。不過簡單來說,就是負責在app裡設計埋點的。

我們知道每一個app其實就像是一座冰山,我們能看到的和體驗到的也只是其中很小的一部分。一般來說,你沒辦法知道在app

上點了一個按鈕後,它在後臺幹了些什麼。

可能它向某個伺服器上傳了某個引數,可能它把你點選按鈕的時間存入了資料庫,也可能什麼都沒幹,只是平白的告訴你「請求失敗」。

而埋點的行為,往往都在這些時候發生。埋點是所有商業應用必需的手段,用來收集app使用者或者裝置的資訊。它實際上就相當於在程式碼裡做了標記,當程式執行到某個位置,就會自動標記上這個。常用的手段是通過將必要的引數上報給伺服器。

比如某某產品的註冊量超過了6億,它是怎麼得到這個資料的呢?就是通過使用者在註冊時,上報這個埋點。最終在後臺統一處理資料,就可以得到更多層次上的資料分析結果。

不誇張的說,現在隨隨便便一個主流app上,都有成千上萬個埋點。這些埋點對使用者而言是無感知的,但是卻無情的暴露了使用者的使用習慣。

資料分析師會根據app的核心指標以及應用場景,設計合適的埋點,並讓開發同學在合適的位置打下這些埋點,然後使用者就能夠在合適的時機上報這些埋點。

使用者的每一次點選,每一個手勢,每一種行為,都會被不同的埋點記錄;甚至,使用者什麼都不幹的時候,也會被記錄下來,因為時間也能反映操作習慣。

這些點位沒有直接的侵入使用者的隱私,沒有獲得你的地理位置,沒有請求你的通訊錄,更沒有開啟你的攝像頭和錄音機,只是單純的記錄下了使用者的操作路徑。如雁過留痕。

2

資料分析師往往鍾情於埋點資料,他們能從一堆埋點中找尋使用者操作的慣性,從而提煉出所謂的使用者心智。但這隻能分析出使用者喜歡或者不喜歡某個功能或者某個頁面。離推薦,還有一定距離。

埋點的資料是很珍貴的使用者資料,除了資料分析師外,還有一群人會對這些資料進行一輪又一輪的處理和提煉。廣義上,這群人都可以被稱作演算法工程師。

資料分析師看重的是群體效益,而演算法的目標則是你的個性化推薦。羊毛出在羊身上,想要推薦出你喜歡的東西,那就得知道你喜歡什麼。

當你在抖音上看到一個美女換裝視訊,停留了許久,並且重複觀看了3次以上,大概率也能推測出你是個lsp了。所以推薦演算法會根據你觀看視訊時上報的埋點,比如觀看時長,點贊數等等量化資料來訓練針對你個人的喜好模型。隨後,不過是對症下藥。

所以為什麼你會在短視訊平臺上老是刷到看不完的妹子,不要先怪平臺,先反省下自己。

到這,一個初級但是有效的獲取使用者習慣的流程已經走完。你在app上花費的每一段時間,都以定量資料都形式存在了伺服器的資料庫裡,經歷著資料分析師的打磨,承受著推薦系統的洗禮。

最終,你的使用習慣被app以及它背後無數個支撐它的系統學習並模仿,雖然直接並且粗暴,但是很有用。

3

但是事情總是沒那麼完美。相同的內容看久了,始終會感到厭倦;那些被資料分析師認為資料正向的功能,也開始多了許多不好的反饋。資料是準確的,無情殘酷的,卻也是片面的。

每一份資料的產生、處理、以及持久化,都只能代表那一個狀態。資料的存在就意味著它是歷史性的,不是當下,更無法代表將來。所以,由資料產生的預測誤差是無法避免的。

隨著人工智慧的興起以及推薦演算法的實際應用,「資訊繭房」這個詞越來越廣泛的出現在各種觀點中。所謂資訊繭房,意味著個人所能接受的資訊被束縛在一個狹窄的領域,個人的認知範圍被侷限在自己的興趣愛好上。

這實際上就是推薦演算法濫用,過度推測使用者的興趣和喜好。在很多深度學習的演算法裡,都會有一個對其「泛化能力」的評估標準。也就是說,有時候精準並不是一件好事,偶爾的擴充套件或許能獲得意想不到的收益。

當然,這裡所說的只是針對使用者的偏主動行為產生的資料所做的分析和推測,而在實際的操作中,還會採用多方面多角度的資料收集手段。那些就跟隱私跟安全許可權息息相關。

總的來說,雖說各種軟體應用不太會偷偷摸摸的去收集使用者行為習慣,但是隻要你使用了,就難免會暴露你的使用者特徵。

這些特徵可能你自己都不曾意識到,但是經過一堆機器的大資料處理,你的某個下意識的操作就有了定量的描述。

現在真正能夠做大做強的軟體應用,都不再是為了提供某個功能,更多的是提供平臺,提供服務。在這些空洞的平臺中,需要大量的使用者行為分析資料作為填充,才能保證平臺服務的正常執行,提供平臺生態的健康發展。

這就是不可擋的趨勢。如果說科技的發展就是人類懶惰化的歷史,那麼為了能夠變得更懶,就需要付出更多的隱私和空間。

不過這樣一來,有些東西就更加難能可貴了。

人生苦短,慢慢瀟灑。 www.zwnsyw.com