幫助

硬核干貨|如何利用邏輯回歸模型,實現(xiàn)用戶增長?

2019-11-18 14:39 運營文檔
技術(shù)派是如何利用邏輯回歸模型實現(xiàn)用戶增長的
 

黃天文將用戶增長分為三大流派,分別是市場營銷派、實驗增長派技術(shù)派,下面簡單介紹下這三大流派:

1、市場營銷派——做品牌和花錢買流量

市場營銷派做不好,叫流量獲取,這活誰都能干,只要給錢就有量;做的好才叫用戶增長,通過對渠道精細(xì)化運營來調(diào)控獲客成本和質(zhì)量。

2、實驗增長派——提出增長假設(shè),做實驗

即,發(fā)現(xiàn)問題、提出想法、預(yù)期效果、測試、復(fù)盤,這5步稱之為一個增長周期,不斷循環(huán)這5步,致使數(shù)據(jù)達(dá)到增長目標(biāo)。

3、技術(shù)派——就是大家常說的“增長黑客”,運用技術(shù)套利,實現(xiàn)低成本增長。

 

市場營銷和實驗增長派在之前的文章里已經(jīng)介紹過(詳見本人之前的文章《如何用更少的錢,帶來更優(yōu)質(zhì)的量?| 渠道質(zhì)量評估模型》和《沒有護(hù)城河的流量池,用戶來得快,流失更快》),所以今天就來個技術(shù)派跟大家分享一下。

真正做到know your customer(不是反洗錢的KYC哦),要像個“跟蹤狂”一樣,跟蹤用戶的關(guān)鍵行為,這個用戶看了首頁、又看了視頻頁、看了13篇文章、分享了1篇文章、點擊下單按鈕了、最終購買了某件商品。

從第一次啟動APP到購買的整個過程,都是你監(jiān)控的范圍。甚至能通過購買前的一些行為,來預(yù)測用戶的購買概率,從而推動成交量的增長。

其實技術(shù)派的例子也是屢見不鮮:

如網(wǎng)飛(Netflix)通過分析客戶觀看的電影和節(jié)目,發(fā)現(xiàn)凱文史派西參演的電影和政治題材的電視劇都非常受用戶歡迎,所以才有的網(wǎng)飛制作電視劇《紙牌屋》;

商務(wù)智能公司RJMetrics的團(tuán)隊發(fā)現(xiàn),在使用其免費產(chǎn)品期間,用過軟件編輯圖表的用戶與沒用過此功能的用戶相比,轉(zhuǎn)化率高出一倍之多,隨后每多使用一次,其購買的可能性就會提高。

通過以上幾個例子,大家可以知道,大體邏輯就是基于用戶的行為,來判斷用戶另外一種行為的概率。紙牌屋的例子是通過用戶的觀看習(xí)慣,來推斷新產(chǎn)品是否受歡迎。RJMetrics公司是通過購買前的某些行為,來判斷用戶是否購買產(chǎn)品。

因此,我們就引出今天的主題:技術(shù)派是如何利用邏輯回歸模型實現(xiàn)用戶增長的——這也是增長三部曲的最后一部。

雖然在當(dāng)下,深度學(xué)習(xí)模型已經(jīng)成為時尚,但邏輯回歸仍然堅守在第一線,靠的就是其高時效性與高準(zhǔn)確度性。許多銀行和金融平臺利用此模型預(yù)測借款人違約的概率,在金融領(lǐng)域都能站住腳,足以看出邏輯回歸的江湖地位。

很多運營同學(xué)聽到邏輯回歸模型都會大驚失色,覺得難度系數(shù)過高,所以文提供了難易兩條路線供大家參考。第一條是“懶人”路線,第二條是“挑戰(zhàn)”路線。

“懶人”路線就是按照下文的步驟,把需求提給技術(shù),也就是建模的過程交給技術(shù)(別跟我說技術(shù)不會邏輯回歸模型,只可能是你魅力不夠~~),在技術(shù)的輔助下,將模型結(jié)果拿來用就OK,適合所有運營人士;

“挑戰(zhàn)”路線則是自己建模分析,有時候人不逼一下自己怎么能行呢!沒準(zhǔn)從此走上了用數(shù)據(jù)說話的道路,告別“數(shù)據(jù)神棍”。另外告訴大家一件事,數(shù)據(jù)運營比運營更來錢,運營的同學(xué)還在等什么,趕緊往數(shù)據(jù)轉(zhuǎn)吧哈哈哈~~

今天來跟大家分享的題目是,如何運用邏輯回歸模型促成交,提高GMV。

在做模型之前,確立自己的目標(biāo)是什么?那就是讓用戶下單,重點放在沒有下單的用戶身上。如何去做?根據(jù)用戶行為,構(gòu)建模型,找出下單用戶畫像。之后呢?我們要做兩件事。第一,引導(dǎo)沒有下單但已經(jīng)具備下單潛質(zhì)的用戶(預(yù)下單用戶)下單。第二,引導(dǎo)用戶成為預(yù)下單用戶。

一、模型搭建

選出你認(rèn)為對下單有影響的變量,然后給到技術(shù),讓技術(shù)算法大神根據(jù)這些行為list(變量)和最后是否下單(因變量)做一個模型,并告訴你模型的可行性和篩選后剩下的變量。如下圖:

用戶行為list圖

 

最后告訴你這個模型O不OK就搞定,OK就進(jìn)入下一環(huán)節(jié),不OK再繼續(xù)改善模型,直到模型成功為止。

有想挑戰(zhàn)的同學(xué),推薦的建模工具有SPSS和python,如果是初學(xué)者的話,建議使用SPSS,操作簡單,不需要編程能力,網(wǎng)上有大量的邏輯回歸模型的教學(xué)視頻,快的一周,慢的一個月怎么也玩明白了。

簡單的說,邏輯回歸模型其實就是:將歷史用戶在下單前或者未下單前的行為,放進(jìn)模型中,模型會模擬出一個方程,之后我們根據(jù)方程套用到新的用戶身上,來判斷哪些用戶下單的概率高,哪些行為對用戶下單影響較大,最后根據(jù)模型來做后續(xù)的策略。

下面我們就來簡述一下建模過程。

(1)  數(shù)據(jù)預(yù)處理

如下圖所示,紅色的“是否下單”這一列是目標(biāo)值,指的是歷史用戶最終是否下單;藍(lán)色的各列是用戶下單前的行為。

下圖可以這樣解讀,每一行就代表著用戶從進(jìn)入平臺到下單(未下單)的全路徑行為。

 

樣本數(shù)據(jù)圖

 

如上圖所示,模型中分為兩種變量,一種是連續(xù)變量,比如“瀏覽頁面數(shù)”,是按照自然數(shù)統(tǒng)計的;另外一種是啞變量,比如“是否下單”,1代表下單,0代表未下單。

到此為止樣本數(shù)據(jù)都已經(jīng)處理完成,接下來就把這些數(shù)據(jù)導(dǎo)入到模型中,模型會給出相應(yīng)的反饋結(jié)果。

(2)  檢驗?zāi)P?/strong>

不是把數(shù)據(jù)扔進(jìn)模型后就完事了,還要看一下模型擬合優(yōu)度,說白了就是模型能不能用。如下圖

模型評估

這里只看步驟二紅框里的幾個數(shù)字就可以。

第一個是-2對數(shù)擬然值,這個值越低越好,在100以下就算可以接受,1000以下嘛也將將可以。第二個就是卡方&顯著性(Sig),卡方一般小于100,Sig<=0.05即可,說明模型當(dāng)中的變量(用戶行為)對下單有顯著影響。

看完這3個數(shù),就證明模型擬合優(yōu)度OK,可以使用。當(dāng)然除了統(tǒng)計學(xué)外,也可以通過AUC值作為模型的評價標(biāo)準(zhǔn)。

二、結(jié)果解讀

勞煩技術(shù)大神或算法大神把下單用戶的行為告訴你,并且把倍數(shù)關(guān)系告訴你,如下圖:

倍數(shù)關(guān)系圖 

上圖的“是否注冊”為2.909,表示注冊的用戶,其下單的概率是未注冊用戶的2.909倍,換而言之,注冊比不注冊下單率高了近3倍。

再看 “生命周期”,生命周期長與生命周期短的比值0.998,說明生命周期越長,下單的概率越小。

至此第二階段就已經(jīng)完成了,開始進(jìn)入第三階段,模型應(yīng)用篇。

將上面(一)中的數(shù)據(jù)輸入到模型中,待模型通過檢驗后,反饋給我們的數(shù)據(jù),就是今天的重點。

模型方程變量圖

上圖的B代表邏輯回歸的系數(shù),SE為標(biāo)準(zhǔn)誤,Wald是Wald卡方值,df為自由度,Sig是顯著程度,Exp(B)代表概率。

模型采用的是向后Wald法,篩選變量,步驟1中,模型發(fā)現(xiàn)是否“完成任務(wù)”對下單影響不顯著,所以在步驟2時,剔除掉此變量,留下的變量都是Sig<0.05的顯著變量。

 通過B值構(gòu)建邏輯回歸模型:

1.069是否注冊+0.93瀏覽新聞視頻數(shù)+0.06APP停留時長+0.076主頁停留時長+0.052啟動次數(shù)+0.004瀏覽頁面數(shù)+0.194看過頁面A+0.767看過成交頁-0.02生命周期-3.571

通過Sig我們可以知道:

當(dāng)Sig<0.05時,該變量十分顯著,經(jīng)過篩選(步驟2),這些變量的Sig全部小于0.05,說明我們選取的行為對下單的影響是非常顯著的。

通過EXP(B)我們可以得到的結(jié)論是:

有過該行為的用戶是沒有該行為用戶下單率的倍數(shù)。以“是否注冊”為例,在其他變量不變的情況下,注冊用戶的下單概率是非注冊用戶的2.909倍??催^頁面A的用戶是沒看過頁面A用戶的1.214倍。

模型結(jié)果解讀后,是不是覺得有很多東西值得我們?nèi)プ龅?,模型雖好但若不能落地等于沒做,還是那句老話,不能將數(shù)據(jù)分析落地執(zhí)行的業(yè)務(wù)需求都是耍流氓,所以我們這就開始講解模型的應(yīng)用場景。

三、模型的應(yīng)用

這一步開始“懶人”路線和“挑戰(zhàn)”路線就合并了,我也終于從“精神分裂模式”回歸成一個人了,不論是運營還是數(shù)據(jù)運營都可以完成本章內(nèi)容,這一章可千萬別懶了。

下面列舉幾個應(yīng)用場景,供大家參考。

應(yīng)用場景一 模型觸達(dá)用戶

觸達(dá)可以分為兩種,全自動觸達(dá)和半自動觸達(dá):

(1)全自動觸達(dá):

通過上述回歸模型,在程序內(nèi)可以將每一個用戶的下單概率算出來,篩選出下單概率高的用戶,自動觸發(fā)短信、PUSH或者紅包。

(2)半自動觸達(dá):

半自動指的是我們并不用上述模型計算概率的方法選擇觸達(dá)用戶,而是將模型輸出的行為(變量)倍數(shù)關(guān)系作為參考,手動去選擇行為的閾值,這樣做可能會比全自動化計算出來的用戶多一點,在預(yù)算不吃緊的情況下可以用這種方式進(jìn)行觸達(dá)。如下圖紅框所示:

半自動閾值圖

應(yīng)用場景二 產(chǎn)品化即時彈窗

當(dāng)用戶滿足上面提到的行為時,自動觸發(fā)彈窗,引導(dǎo)用戶下單。

這種方法其實要比場景一的轉(zhuǎn)化率高很多,因為觸達(dá)短信屬于后置動作,用戶在收到短信時,可能已經(jīng)錯過最好轉(zhuǎn)化時機(jī)。而自動彈窗,會在用戶意愿值最高時,及時提醒并轉(zhuǎn)化。

這種產(chǎn)品化彈窗并不少見,比如騰訊的和平精英游戲,會在你獲得勝利(吃雞)時,彈出窗口,提醒你去應(yīng)用商店給游戲打分。這樣做不僅能夠提高用戶評分率,還能保證好評率,是一種經(jīng)典的產(chǎn)品運營方式。

應(yīng)用場景三 產(chǎn)品化調(diào)整

通過模型我們知道提高下單轉(zhuǎn)化的三個重點指標(biāo)依次為注冊看過頁面A看過成交頁。

那么我們從產(chǎn)品層面,要做一些調(diào)整,比如通過強(qiáng)制注冊或者調(diào)小注冊頁的跳過按鈕來提高注冊率;調(diào)整成交頁的下單按鈕的大小、位置和顏色;改變頁面A的入口深度,讓用戶更容易進(jìn)入該頁等等;不要小看這些操作,比如下圖,將注冊頁由表單形式改成分布式,注冊率就能提升7%,如下圖所示:

 產(chǎn)品改動提升注冊率圖

 

總而言之,我們通過改動產(chǎn)品,帶動重點指標(biāo)增長,從而提高下單轉(zhuǎn)化率,是一種“曲線救國”的方法。

四、模型的拓展

模型的拓展主要分為兩個方面,自身優(yōu)化和橫向拓展。自身優(yōu)化主要是針對下單模型如何進(jìn)一步優(yōu)化,提高準(zhǔn)確度;橫向拓展是將模型套用到其他業(yè)務(wù)上,不光下單可以使用該模型,用戶留存、UGC互動行為等都可套用。

至此,整個邏輯回歸模型流程已經(jīng)介紹完畢,后續(xù)還有多種分析方法以及策略,在這里只是拋磚引玉,就不多贅述了。

今天講的邏輯回歸模型可能有些硬核,其實模型原理很簡單,就是根據(jù)用戶的行為,去推斷用戶另一種行為的概率。邏輯回歸模型是一線機(jī)器學(xué)習(xí)工程師最愛模型,并非浪得虛名,熟練掌握此模型會對業(yè)務(wù)有非常大的幫助。

最后,我們就把今天分析的過程捋一捋:

模型流程圖

(1)確定增長目標(biāo)

(2)用戶行為數(shù)據(jù)準(zhǔn)備

(3)模型調(diào)試

(4)模型結(jié)果解讀

(5)模型的應(yīng)用(產(chǎn)品層、技術(shù)層、運營層)

今天給大家介紹的技術(shù)派用戶增長之邏輯回歸模型就到這里了,這也是用戶增長三大流派中最難的一種,但也并非可遇不可求,相信自己。


相關(guān)推薦

QQ在線咨詢