❶ 如何進行准確的用戶畫像分析
一個標簽通常是人為規定的高度精煉的特徵標識,如年齡段標簽:25~35歲,地域標簽:北京,標簽呈現出兩個重要特徵:語義化,人能很方便地理解每個標簽含義。這也使得用戶畫像模型具備實際意義。能夠較好的滿足業務需求。如,判斷用戶偏好。短文本,每個標簽通常只表示一種含義,標簽本身無需再做過多文本分析等預處理工作,這為利用機器提取標准化信息提供了便利。 人制定標簽規則,並能夠通過標簽快速讀出其中的信息,機器方便做標簽提取、聚合分析。所以,用戶畫像,即:用戶標簽,向我們展示了一種樸素、簡潔的方法用於描述用戶信息。 3.1 數據源分析 構建用戶畫像是為了還原用戶信息,因此數據來源於:所有用戶相關的數據。 對於用戶相關數據的分類,引入一種重要的分類思想:封閉性的分類方式。如,世界上分為兩種人,一種是學英語的人,一種是不學英語的人;客戶分三類,高價值客戶,中價值客戶,低價值客戶;產品生命周期分為,投入期、成長期、成熟期、衰退期…所有的子分類將構成了類目空間的全部集合。 這樣的分類方式,有助於後續不斷枚舉並迭代補充遺漏的信息維度。不必擔心架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據應用場景,業務需求的不同,也許各有道理,按需劃分即可。 本文將用戶數據劃分為靜態信息數據、動態信息數據兩大類。 靜態信息數據 用戶相對穩定的信息,如圖所示,主要包括人口屬性、商業屬性等方面數據。這類信息,自成標簽,如果企業有真實信息則無需過多建模預測,更多的是數據清洗工作,因此這方面信息的數據建模不是本篇文章重點。 動態信息數據 用戶不斷變化的行為信息,如果存在上帝,每一個人的行為都在時刻被上帝那雙無形的眼睛監控著,廣義上講,一個用戶打開網頁,買了一個杯子;與該用戶傍晚溜了趟狗,白天取了一次錢,打了一個哈欠等等一樣都是上帝眼中的用戶行為。當行為集中到互聯網,乃至電商,用戶行為就會聚焦很多,如上圖所示:瀏覽凡客首頁、瀏覽休閑鞋單品頁、搜索帆布鞋、發表關於鞋品質的微博、贊「雙十一大促給力」的微博消息。等等均可看作互聯網用戶行為。 本篇文章以互聯網電商用戶,為主要分析對象,暫不考慮線下用戶行為數據(分析方法雷同,只是數據獲取途徑,用戶識別方式有些差異)。 在互聯網上,用戶行為,可以看作用戶動態信息的唯一數據來源。如何對用戶行為數據構建數據模型,分析出用戶標簽,將是本文著重介紹的內容。 3.2 目標分析 用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。如,紅酒 0.8、李寧 0.6。 標簽,表徵了內容,用戶對該內容有興趣、偏好、需求等等。 權重,表徵了指數,用戶的興趣、偏好指數,也可能表徵用戶的需求度,可以簡單的理解為可信度,概率。 3.3 數據建模方法 下面內容將詳細介紹,如何根據用戶行為,構建模型產出標簽、權重。一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件,可以詳細描述為:什麼用戶,在什麼時間,什麼地點,做了什麼事。 什麼用戶:關鍵在於對用戶的標識,用戶標識的目的是為了區分用戶、單點定位。 以上列舉了互聯網主要的用戶標識方法,獲取方式由易到難。視企業的用戶粘性,可以獲取的標識信息有所差異。 什麼時間:時間包括兩個重要信息,時間戳+時間長度。時間戳,為了標識用戶行為的時間點,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常採用精度到秒的時間戳即可。因為微秒的時間戳精度並不可靠。瀏覽器時間精度,准確度最多也只能到毫秒。時間長度,為了標識用戶在某一頁面的停留時間。 什麼地點:用戶接觸點,Touch Point。對於每個用戶接觸點。潛在包含了兩層信息:網址 + 內容。網址:每一個url鏈接(頁面/屏幕),即定位了一個互聯網頁面地址,或者某個產品的特定頁面。可以是PC上某電商網站的頁面url,也可以是手機上的微博,微信等應用某個功能頁面,某款產品應用的特定畫面。如,長城紅酒單品頁,微信訂閱號頁面,某游戲的過關頁。 內容:每個url網址(頁面/屏幕)中的內容。可以是單品的相關信息:類別、品牌、描述、屬性、網站信息等等。如,紅酒,長城,干紅,對於每個互聯網接觸點,其中網址決定了權重;內容決定了標簽。 註:接觸點可以是網址,也可以是某個產品的特定功能界面。如,同樣一瓶礦泉水,超市賣1元,火車上賣3元,景區賣5元。商品的售賣價值,不在於成本,更在於售賣地點。標簽均是礦泉水,但接觸點的不同體現出了權重差異。這里的權重可以理解為用戶對於礦泉水的需求程度不同。即,願意支付的價值不同。 標簽 權重 礦泉水 1 // 超市 礦泉水 3 // 火車 礦泉水 5 // 景區 類似的,用戶在京東商城瀏覽紅酒信息,與在品尚紅酒網瀏覽紅酒信息,表現出對紅酒喜好度也是有差異的。這里的關注點是不同的網址,存在權重差異,權重模型的構建,需要根據各自的業務需求構建。 所以,網址本身表徵了用戶的標簽偏好權重。網址對應的內容體現了標簽信息。 什麼事:用戶行為類型,對於電商有如下典型行為:瀏覽、添加購物車、搜索、、購買、點擊贊、收藏 等等。 不同的行為類型,對於接觸點的內容產生的標簽信息,具有不同的權重。如,購買權重計為5,瀏覽計為1 紅酒 1 // 瀏覽紅酒 紅酒 5 // 購買紅酒 綜合上述分析,用戶畫像的數據模型,可以概括為下面的公式:用戶標識 + 時間 + 行為類型 + 接觸點(網址+內容),某用戶因為在什麼時間、地點、做了什麼事。所以會打上**標簽。 用戶標簽的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型、網址決定了權重,內容決定了標簽,進一步轉換為公式: 標簽權重=衰減因子×行為權重×網址子權重 如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城干紅葡萄酒信息。 標簽:紅酒,長城 時間:因為是昨天的行為,假設衰減因子為:r=0.95 行為類型:瀏覽行為記為權重1 地點:品尚紅酒單品頁的網址子權重記為 0.9(相比京東紅酒單品頁的0.7) 假設用戶對紅酒出於真的喜歡,才會去專業的紅酒網選購,而不再綜合商城選購。 則用戶偏好標簽是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665。 上述模型權重值的選取只是舉例參考,具體的權重值需要根據業務需求二次建模,這里強調的是如何從整體思考,去構建用戶畫像模型,進而能夠逐步細化模型。
❷ 抖音新手該怎麼養號
抖音新手養號要做到一機一個賬號、完善個人信息、對自己進行定位、對視頻內容分析,具體介紹如下:
1、保證一部手機一個賬號,抖音支持登錄多賬號,但是養號降低風險最好的做法是注冊新賬號之後最好固定用一部手機的一個手機號注冊一個抖音號。
2、注冊抖音賬號之後,可以修改個人信息,用戶名和頭像設置盡量簡潔大方,不要涉及到敏感詞彙。
3、注冊完之後先別急著發視頻,找到自己賬號定位的對標賬號,看別人的視頻是怎麼發的,然後根據自己的賬號定位去瀏覽相關視頻內容,並進行點贊、評論、轉發等操作。
4、對視頻內容分析,觀察有哪些因素會對賬號造成影響,總結出來各類因素,以後避免發這些內容。
注意事項:
1、在抖音上,女性用戶的比例是高於男性的。一般來說,推理類、穿搭類、情感類、母嬰類、美食類等賬號,都是現階段很適合女性粉絲起量的領域。
2、用戶在做抖音之前,必須有非常明確的賬號運營策略,也必須清楚地知道自己的產品或者服務是什麼,想要吸引的目標人群到底是誰,以及這些人群可能會喜歡哪些內容。
❸ 百度知道的用戶標簽有什麼用啊
用戶標簽,差不多就是您的知識領域。
假設您的用戶標簽有一個「計算機」,那麼就代表您懂計算機方面的知識。
然後我的興趣,就相當於再細分「計算機」領域裡面的東西。畢竟您不一定懂所有計算機方面的知識。假設您懂內存條,但您不了解硬碟。所以您就可以設置「內存條」這個興趣條,讓網路知道系統向您推送關於內存條相關的問題,而不是硬碟相關的問題。
❹ 微信的用戶標簽怎麼建立
如何去建立用戶標簽?這件事兒其實是要結合到業務自身的,所以,通常用戶標簽會包含「基礎標簽」和「業務標簽」。
「基礎標簽」非常簡單,有關用戶基礎屬性的標簽就可以歸屬在這一類,譬如:性別、年齡、居住地、工作地、生日、手機品牌、上網環境,等等……
「業務標簽」就是結合業務去歸類的標簽集合,譬如:
運營商會關註:套餐類型、入網年限、通話時長、流量消費等
信用卡會關註:信用卡額度、月消費額度、還款方式、還款金額、分期偏好等等
所以,建立用戶標簽其實就是結合業務實際、根據業務需求去將用戶的基本信息和業務行為抽取並分門別類,沒有統一的標准答案,不是好與不好的問題,而是是否合適的問題。
❺ 電商平台如何更好地構建用戶標簽體系
構建用戶標簽體系主要根據用戶在歷史時間內的網購行為記錄,從網購時間點、內容深度剖析,針對用戶的基礎屬性、社交行為、互動行為、消費行為、偏好習慣、財富屬性、信用屬性和地理屬性等八大維度構建用戶標簽體系,以期綜合描繪平台消費者的行為特徵。
這其中,除了業務的輸入以及數據的支撐外,要想快速建立一套科學的標簽體系,還需要豐富的技術經驗以及智能的工具或平台來提供助力,如阿里雲或袋鼠雲的數據中台。
❻ 如何利用用戶標簽數據
推薦系統的目的是聯系用戶的興趣和物品,這種聯系需要依賴於不同的媒介。GroupLens在文章1中認為目前流行的推薦系統基本上通過三種方式來聯系用戶興趣和物品。如圖1所示,第一種方式是通過用戶喜歡過的物品:可以給用戶推薦與他喜歡過的物品相似的物品,這就是前面提到的基於物品的演算法(item-based)。第二種方式是通過和用戶興趣相似的其他用戶:可以給用戶推薦那些和他們興趣愛好相似的其他用戶喜歡的物品,這也是前面提到的基於用戶的演算法(user-based)。除了這兩種方法,第三個也是最重要的方式是通過一些特徵(feature)來聯系用戶和物品,可以給用戶推薦那些具有用戶喜歡的特徵的物品。這里的特徵有不同的表現方式,比如可以表現為物品的屬性集合(比如對於圖書,屬性集合就包括了作者、出版社、主題和關鍵詞等),也可以表現為隱語義向量(latent factor vector),這可以通過前面提出的隱語義模型(Latent Factor Model)學習得到。在本章中,我們將討論一種重要的特徵表現方式:標簽。
圖1 推薦系統聯系用戶和物品的幾種途徑
根據維基網路的定義2,標簽是一種無層次化結構的、用來描述信息的關鍵詞。因此,標簽可以用來准確地描述物品的語義。根據給物品打標簽的人的不同,標簽應用一般分為兩種。第一種是讓作者或者編輯給物品打標簽,而另一種是讓普通用戶給物品打標簽,也就是UGC的標簽應用。表1列出了這兩種不同的標簽系統的代表網站。在本章中,我們主要討論UGC的標簽應用,研究用戶給物品打標簽的行為,以及如何通過分析這種行為給用戶進行個性化推薦。
表1 兩種不同的標簽系統的代表網站
UGC的標簽系統是一種很重要的表示用戶興趣和物品語義的方式。當一個用戶對一個物品打上一個標簽後,這個標簽一方面描述了用戶的興趣,另一方面也表示了物品的語義,從而將用戶和物品聯系了起來。
UGC標簽系統的代表應用
UGC標簽系統是很多Web 2.0網站的必要組成部分,本節將討論使用UGC標簽系統的代表網站:UGC標簽系統的鼻祖美味書簽(Delicious)、論文書簽網站CiteULike、音樂網站Lastfm、視頻網站Hulu、書和電影評論網站豆瓣等。下面將分別介紹這些應用。
Delicious
美味書簽(Delicous)是標簽系統里的開山鼻祖了,它允許用戶給互聯網上的每個網頁打上標簽,從而通過標簽的方式重新組織整個互聯網。圖2是Delicious中被用戶打上recommender system標簽最多的網頁,這些網頁反應了用戶心目中和推薦系統最相關的網頁。圖3是Delicious中「豆瓣電台」這個網頁被用戶打的最多的標簽,可以看到這些標簽確實准確地描述了豆瓣電台。
圖2 Delicious中被打上recommender system標簽的網頁
圖3 Delicious中「豆瓣電台」網頁被用戶打的最多的標簽
CiteULike
CiteULike是一個著名的論文書簽網站,它允許研究人員提交或者收藏他們感興趣的論文,給論文打標簽,從而幫助用戶更好地發現和自己研究領域相關的優秀論文。我們知道,研究人員搜索自己研究領域值得參考的論文是很費時費力的工作,而CiteULike通過群體智能,讓每個研究人員對自己了解的論文進行標記,從而幫助用戶更好更快地發現自己感興趣的論文。圖4展示了CiteULike中一篇被用戶打的標簽最多的有關推薦系統評測的文章,可以發現,最多的兩個標簽是collaborative-filtering(協同過濾)和evaluate(評測),確實比較准確地反應了這篇論文的主要內容。
圖4 CiteULike中一篇論文的標簽
Lastfm
Lastfm是一家著名的音樂網站,它通過分析用戶的聽歌行為來預測用戶對音樂的興趣,從而給用戶推薦個性化的音樂。作為多媒體,音樂不像文本那樣可以很容易地分析它的內容信息。為了在不進行復雜的音頻分析的情況下獲得音樂的內容信息,Lastfm引用了標簽系統,讓用戶用標簽標記音樂和歌手。圖5展示了披頭士樂隊在Lastfm中的標簽雲(tag cloud)。從這個標簽雲可以看到,披頭士應該是一個英國的傳統搖滾樂隊,流行於上世紀60年代。
圖5 Lastfm中披頭士樂隊的標簽雲
豆瓣
豆瓣是中國著名的評論和社交網站,同時也是中國個性化推薦鄰域的領軍企業之一。豆瓣在個性化推薦領域進行了廣泛的嘗試,標簽系統也是他們嘗試的領域之一。他們允許用戶對圖書和電影進行標簽,從而獲得圖書和電影的內容信息,並用這種信息來改善他們的推薦效果。圖7展示了《數據挖掘導論》在豆瓣被用戶標記的情況。如圖7所示,最多的幾個標簽分別是:數據挖掘、計算機、計算機科學、數據分析、IT數據分析。這些標簽准確地反應了這本書的內容信息。
圖6 豆瓣讀書中《數據挖掘導論》一書的常用標簽
Hulu
Hulu是美國著名的視頻網站。視頻作為一種最為復雜的多媒體,獲取它的內容信息是最困難的,因此,Hulu也引入了用戶標簽系統來讓用戶對電視劇和電影進行標記。圖7展示了美劇《豪斯醫生》的常用標簽,可以看到,Hulu對標簽做了分類,並展示了每一類最熱門的標簽。從類型(genre)看,豪斯醫生是一部醫學片(medical drama);從時間看,這部劇開始於2004年;從人物看,這部美劇的主演是hugh laurie,他在劇中飾演的人物是greg house。
圖7 Hulu中《豪斯醫生》的常用標簽
從前面的各種應用可以看到,標簽系統在各種各樣的網站中(音樂、視頻和社交等)都得到了廣泛的應用。標簽系統的最大優勢在於可以發揮群體的智能,獲得物品內容信息的比較准確的關鍵詞描述,而准確的內容信息是提升個性化推薦系統的重要資源。
標簽系統中的推薦問題
標簽行為作為一種重要的用戶行為,蘊含了很多反映用戶興趣的信息,因此深入研究用戶的標簽行為可以很好地指導個性化推薦系統提升自己的推薦質量。同時,標簽作為一種重要的內容表示方式,比傳統的內容屬性表示更能反應用戶對物品的看法,並且表示形式非常簡單,便於很多演算法處理。
標簽系統中的推薦問題主要有以下兩個。
如何利用用戶的標簽行為給用戶推薦物品(tag-based recommendation)?
如何在用戶給物品打標簽時給用戶推薦適合於該物品的標簽(tag recommendation)?
為了研究上面的兩個問題,我們首先需要解答下面三個問題。
用戶為什麼要打標簽(Why)?
用戶怎麼打標簽(How)?
用戶打什麼樣的標簽(What)?
用戶為什麼要標注
在設計基於Tag的個性化推薦系統之前,我們需要深入了解用戶的標注行為,知道用戶為什麼要標注,用戶怎麼標注,只有深刻地了解用戶的行為,我們才能基於這個行為給用戶設計出令他們滿意的個性化推薦系統。
Morgan Ames研究圖片分享網站中用戶標注的動機問題3,他將用戶標注的動機分解成兩個維度。首先是社會維度,有些用戶標注是為了給內容的上傳者使用的,而有些用戶標注是為了給廣大用戶使用的。令一個維度是功能維度,有些標注是為了更好地組織內容,方便用戶將來的查找,而另一些標注是為了傳達某種信息,比如照片的拍攝時間和地點等。
用戶如何打標簽
在互聯網中,盡管每個用戶的行為看起來是隨機的,但其實這些表面隨機的行為的背後蘊含著很多規律。在這一節中,我們通過研究美味書簽的數據集,來發現用戶標注行為中的一些統計規律。
德國的研究人員公布過一個很龐大的美味書簽的數據集4,該數據集包含了2003年9月到2007年12月美味書簽用戶4.2億條標簽行為記錄。本節選用該數據集2007年一整年的數據進行分析,對該數據集的統計特性進行研究。
本節將統計數據集的以下信息。
用戶活躍度的分布。
物品流行度的分布。
標簽熱門度的分布。
用戶標簽行為隨時間演化的曲線。
用戶相隔一段時間興趣變化的情況。
物品的生命周期。
*[****具體統計結果待書正式出版時公布**]*
用戶打什麼樣的標簽
用戶在看到一個物品時,我們最希望他打的標簽是能夠准確描述物品內容屬性的關鍵詞。但用戶往往不是按照我們的想法去操作,而是可能會給物品打上各種各樣奇怪的標簽。
Scott A. Golder 總結了美味書簽上的標簽,將它們分為如下的幾類。
表明物品是什麼:比如是一隻鳥,就會有「鳥」這個詞的標簽;是豆瓣的首頁,就有一個標簽叫「豆瓣」;是喬布斯的首頁,就會有個標簽叫「喬布斯」。
表明物品的種類:比如在美味書簽中,表示一個網頁的類別的標簽包括 article(文章)、 blog(博客)、 book(圖書)等。
表明誰擁有物品 :比如很多博客的標簽中會包括博客的作者等信息。
表達用戶的觀點:比如用戶認為網頁很有趣,就會有funny(有趣)的標簽,認為很無聊,就會打上boring(無聊)的標簽。
用戶相關的標簽:有些標簽,比如 my favorite(我最喜歡的)、my comment(我的評論)等。
用戶的任務:比如 to read(即將閱讀)、 job search(找工作)等。
很多不同的網站也設計了自己的標簽分類系統,比如Hulu對視頻的標簽就做了分類。
圖8是著名的美劇《豪斯醫生》的標簽。可以看到,Hulu將電視劇的標簽分成了幾類。
類型(Genre):主要表示這個電視劇的類別,比如《豪斯醫生》是屬於醫學劇情片(medical drama),同時有喜劇(comedy)、懸疑(mystery)的成分。
時間(Time):主要包括電視劇發布的時間,有時也包括電視劇中事件發生的時間,比如是二戰期間,或者是上世紀90年代。
人物(People):主要包括電視劇的導演、演員和劇中重要人物等。
地點(Place):劇情發生的地點,或者是視頻拍攝的地點等。
語言(Language):這部電視劇使用的語言。
獎項(Awards):這部電視劇獲得的相關獎項。
其他(Details):包含了不能歸類到上面各類的其他所有標簽。
圖8 著名美劇《豪斯醫生》在視頻網站Hulu上的
❼ 請問RFID標簽用戶區數據具體是怎麼存儲的,以及移動讀寫器如何與javaWeb程序交互
數據塊寫操作
選擇標簽(圖3-1中1),選擇存儲區(圖3-1中2,只有EPC區和用戶區可以寫入數據),填寫起始地址和讀取長度(圖3-1中3),註: 起始地址:0x00 表示從第一個字(相應存儲區第一個16位)開始讀,0x01表示從第2個字開始讀,依次類推。讀長度:要讀取的字的個數。不能為0x00,不能超過120,即最多讀取120個字。若設置為0或者超過了120,將返回參數出錯的消息。訪問密碼:從左到右為從高位到低位,2字的訪問密碼的最高位在第一字,如果電子標簽沒有設置訪問密碼,則訪問密碼部分可以為任意值,但不能缺失。填寫需要寫入的數據(圖3-1中4),點擊寫(圖3-1中5),左下角看到「寫數據」按鈕執行成功,點擊「讀」按鈕則右邊框中顯示讀取到的數據(圖3-1中6 ),點擊「清除顯示」即可清空數據顯示區內容。
詳情請見 http://wenku..com/view/af1169e3f524ccbff121844a 第十四頁
如果需要在web調用讀寫 需要編寫瀏覽器的OCX文件
❽ 用戶分類,用戶標簽一般都是怎麼分類,怎麼貼標簽的
這很多了,不同的行業分類的重點不一樣。
一般來說用戶分類標簽可按照:地域,年齡,性別,收入消費水平,個人關注等緯度來分類
❾ 大數據分析中,有哪些常見的大數據分析模型
對於互聯網平台而言的產品,主要可以分為兩大類:商品和服務。想要通過數據分析提高產品的銷量,首先要了解哪些數據需要分析?
哪些數據需要分析?
一、運營模塊
從用戶的消費流程來看,可以劃分為四個部分:引流,轉化,消費,存留。
流量
流量主要體現在引流環節,按照流量結構可以分為渠道結構,業務結構以及地區結構等。渠道結構,可以追蹤各個渠道的流量情況,通過渠道流量佔比來分析各渠道的質量。業務結構,根據指定業務對活動的流量進行追蹤,觀察活動前,中,後流量的變化情況,對活動效果做出評估。
轉化率
轉化率=期望行為人數/作用總人數。提升轉化率意味著更低的成本,更高的利潤, 最經典的分析模型就是漏斗模型。
流失率和留存率
通過各個渠道或者活動把用戶引流過來,但過一段時間就會有用戶流失掉,這部分用戶就是流失用戶,而留下來的這部分用戶就是留存用戶。流失可以分為剛性流失,體驗流失和競爭流失,雖然流失是不可避免的,但可以根據對流失的分析,做出相應的對策來挽留用戶。關於留存,通過觀察存留的規律,定位存留階段,可以輔助市場活動、市場策略定位等,同時還可以對比不同用戶、產品的功能存留情況,分析產品價值,及時對產品做出調整。
復購率
復購率可以分為「用戶復購率」和「訂單復購率」,通過分析復購率,可以進一步對用戶粘性進行分析,輔助發現復購率問題,制定運營策略, 同事還可以進行橫向(商品、用戶、渠道)對比分析, 細化復購率,輔助問題定位。
二、銷售模塊
銷售模塊中有大量的指標,包括同環比、完成率、銷售排行、重點商品佔比、平台佔比等等。
三、商品模塊
重要指標分析:包括貨齡、動銷率、缺貨率、結構指標、價格體系、關聯分析、暢滯銷分析等, 用來評判商品價值,輔助調整商品策略
四、用戶模塊
重點指標分析:包括新增用戶數、增長率、流失率、有效會員佔比、存留情況等
用戶價值分析:可以根據RFM模型,再融入其他個性化參數,對用戶進行價值的劃分,並針對各等級用戶做出進一步分析。
用戶畫像:根據固有屬性、行為屬性、交易屬性、興趣愛好等維度,來為用戶添加標簽與權重,設計用戶畫像,提供精準營銷參考依據。
根據需要分析的數據選擇分析模型
一、用戶模型
用戶模型是一種在營銷規劃或商業設計上描繪目標用戶的方法,經常有多種組合,方便規劃者用來分析並設置其針對不同用戶所展開的策略。傳統的用戶模型構建方法有兩種:基於訪談和觀察構建用戶模型(嚴謹可靠但費時)、臨時用戶模型(基於行業專家或者市場調查數據構建,快速但不夠可靠)。
改進的用戶模型構建方法:基於用戶行為數據的用戶模型
優勢:對傳統方式進行簡化,降低數據分析的門檻;讓數據分析更科學、高效、全面,可以更直接地應用於業務增長,指導運營策略。
方法:
1. 整理、收集對用戶的初始認知
2. 對用戶進行分群
3. 分析用戶的行為數據
4. 推測目標動機
5. 對用戶進行訪談調查驗證
6. 用戶模型建立修正
同時,還可以將收集到的用戶信息映射成為用戶的屬性或用戶的行為信息,並存儲起來形成用戶檔案;實時關注自身數據的波動,及時做出戰略性調整。
二、事件模型
事件模型是用戶行為數據分析的第一步,也是分析的核心和基礎,它背後的數據結構、採集時機以及對事件的管理是事件模型中的三大要素。
什麼是事件?
事件就是用戶在產品上的行為,它是用戶行為的一個專業描述,用戶在產品上所有獲得的程序反饋都可以抽象為事件,由開發人員通過埋點進行採集。舉個例子:用戶在頁面上點擊按鈕就是一個事件。
事件的採集
事件-屬性-值的結構:事件(用戶在產品上的行為),屬性(描述事件的維度),值(屬性的內容)
在事件採集過程中,靈活運用事件-屬性-值的結構,不僅可以最大化還原用戶使用場景,還可以極大地節省事件量,提高工作效率。
採集的時機:用戶點擊、網頁載入完成、伺服器判斷返回。在設計埋點需求文檔時,採集時機的說明尤為重要,也是保證數據准確性的核心。
舉個例子:電商銷售網頁的事件採集
上圖中,每一環代表用戶的一步,不同的顏色代表不同的行為,同一環顏色佔比越大代表在當前步驟中用戶行為越統一,環越長說明用戶的行為路徑越長。
八、用戶分群模型
用戶分群即用戶信息標簽化,通過用戶的歷史行為路徑、行為特徵、偏好等屬性,將具有相同屬性的用戶劃分為一個群體,並進行後續分析。
基於用戶行為數據的分群模型:當回歸到行為數據本身,會發現對用戶的洞察可以更精細更溯源,用歷史行為記錄的方式可以更快地找到想要的人群。
四個用戶分群的維度:
用戶屬性:年齡、性別、城市、瀏覽器版本、系統版本、操作版本、渠道來源等;
活躍於:通過設置活躍時間,找到指定之間段內的活躍用戶;
做過/沒做過:通過用戶是否進行某行為,分析用戶與產品交互的「親密度」;
新增於:通過設置時間段,精確篩選出新增用戶的時間范圍;
如何提高產品銷量是一個綜合性的問題,需要結合多種模型進行數據分析,以上內容是對一些知識的歸納,希望能夠對您有所幫助。
❿ 如何構建用戶畫像
一個標簽通常是人為規定的高度精煉的特徵標識,如年齡段標簽:25~35歲,地域標簽:北京,標簽呈現出兩個重要特徵:語義化,人能很方便地理解每個標簽含義。這也使得用戶畫像模型具備實際意義。能夠較好的滿足業務需求。如,判斷用戶偏好。短文本,每個標簽通常只表示一種含義,標簽本身無需再做過多文本分析等預處理工作,這為利用機器提取標准化信息提供了便利。
人制定標簽規則,並能夠通過標簽快速讀出其中的信息,機器方便做標簽提取、聚合分析。所以,用戶畫像,即:用戶標簽,向我們展示了一種樸素、簡潔的方法用於描述用戶信息。
3.1 數據源分析
構建用戶畫像是為了還原用戶信息,因此數據來源於:所有用戶相關的數據。
對於用戶相關數據的分類,引入一種重要的分類思想:封閉性的分類方式。如,世界上分為兩種人,一種是學英語的人,一種是不學英語的人;客戶分三類,高價值客戶,中價值客戶,低價值客戶;產品生命周期分為,投入期、成長期、成熟期、衰退期…所有的子分類將構成了類目空間的全部集合。
這樣的分類方式,有助於後續不斷枚舉並迭代補充遺漏的信息維度。不必擔心架構上對每一層分類沒有考慮完整,造成維度遺漏留下擴展性隱患。另外,不同的分類方式根據應用場景,業務需求的不同,也許各有道理,按需劃分即可。
本文將用戶數據劃分為靜態信息數據、動態信息數據兩大類。
靜態信息數據
用戶相對穩定的信息,如圖所示,主要包括人口屬性、商業屬性等方面數據。這類信息,自成標簽,如果企業有真實信息則無需過多建模預測,更多的是數據清洗工作,因此這方面信息的數據建模不是本篇文章重點。
動態信息數據
用戶不斷變化的行為信息,如果存在上帝,每一個人的行為都在時刻被上帝那雙無形的眼睛監控著,廣義上講,一個用戶打開網頁,買了一個杯子;與該用戶傍晚溜了趟狗,白天取了一次錢,打了一個哈欠等等一樣都是上帝眼中的用戶行為。當行為集中到互聯網,乃至電商,用戶行為就會聚焦很多,如上圖所示:瀏覽凡客首頁、瀏覽休閑鞋單品頁、搜索帆布鞋、發表關於鞋品質的微博、贊「雙十一大促給力」的微博消息。等等均可看作互聯網用戶行為。
本篇文章以互聯網電商用戶,為主要分析對象,暫不考慮線下用戶行為數據(分析方法雷同,只是數據獲取途徑,用戶識別方式有些差異)。
在互聯網上,用戶行為,可以看作用戶動態信息的唯一數據來源。如何對用戶行為數據構建數據模型,分析出用戶標簽,將是本文著重介紹的內容。
3.2 目標分析
用戶畫像的目標是通過分析用戶行為,最終為每個用戶打上標簽,以及該標簽的權重。如,紅酒 0.8、李寧 0.6。
標簽,表徵了內容,用戶對該內容有興趣、偏好、需求等等。
權重,表徵了指數,用戶的興趣、偏好指數,也可能表徵用戶的需求度,可以簡單的理解為可信度,概率。
3.3 數據建模方法
下面內容將詳細介紹,如何根據用戶行為,構建模型產出標簽、權重。一個事件模型包括:時間、地點、人物三個要素。每一次用戶行為本質上是一次隨機事件,可以詳細描述為:什麼用戶,在什麼時間,什麼地點,做了什麼事。
什麼用戶:關鍵在於對用戶的標識,用戶標識的目的是為了區分用戶、單點定位。
以上列舉了互聯網主要的用戶標識方法,獲取方式由易到難。視企業的用戶粘性,可以獲取的標識信息有所差異。
什麼時間:時間包括兩個重要信息,時間戳+時間長度。時間戳,為了標識用戶行為的時間點,如,1395121950(精度到秒),1395121950.083612(精度到微秒),通常採用精度到秒的時間戳即可。因為微秒的時間戳精度並不可靠。瀏覽器時間精度,准確度最多也只能到毫秒。時間長度,為了標識用戶在某一頁面的停留時間。
什麼地點:用戶接觸點,Touch Point。對於每個用戶接觸點。潛在包含了兩層信息:網址 + 內容。網址:每一個url鏈接(頁面/屏幕),即定位了一個互聯網頁面地址,或者某個產品的特定頁面。可以是PC上某電商網站的頁面url,也可以是手機上的微博,微信等應用某個功能頁面,某款產品應用的特定畫面。如,長城紅酒單品頁,微信訂閱號頁面,某游戲的過關頁。
內容:每個url網址(頁面/屏幕)中的內容。可以是單品的相關信息:類別、品牌、描述、屬性、網站信息等等。如,紅酒,長城,干紅,對於每個互聯網接觸點,其中網址決定了權重;內容決定了標簽。
註:接觸點可以是網址,也可以是某個產品的特定功能界面。如,同樣一瓶礦泉水,超市賣1元,火車上賣3元,景區賣5元。商品的售賣價值,不在於成本,更在於售賣地點。標簽均是礦泉水,但接觸點的不同體現出了權重差異。這里的權重可以理解為用戶對於礦泉水的需求程度不同。即,願意支付的價值不同。
標簽 權重
礦泉水 1 // 超市
礦泉水 3 // 火車
礦泉水 5 // 景區
類似的,用戶在京東商城瀏覽紅酒信息,與在品尚紅酒網瀏覽紅酒信息,表現出對紅酒喜好度也是有差異的。這里的關注點是不同的網址,存在權重差異,權重模型的構建,需要根據各自的業務需求構建。
所以,網址本身表徵了用戶的標簽偏好權重。網址對應的內容體現了標簽信息。
什麼事:用戶行為類型,對於電商有如下典型行為:瀏覽、添加購物車、搜索、評論、購買、點擊贊、收藏 等等。
不同的行為類型,對於接觸點的內容產生的標簽信息,具有不同的權重。如,購買權重計為5,瀏覽計為1
紅酒 1 // 瀏覽紅酒
紅酒 5 // 購買紅酒
綜合上述分析,用戶畫像的數據模型,可以概括為下面的公式:用戶標識 + 時間 + 行為類型 + 接觸點(網址+內容),某用戶因為在什麼時間、地點、做了什麼事。所以會打上**標簽。
用戶標簽的權重可能隨時間的增加而衰減,因此定義時間為衰減因子r,行為類型、網址決定了權重,內容決定了標簽,進一步轉換為公式:
標簽權重=衰減因子×行為權重×網址子權重
如:用戶A,昨天在品尚紅酒網瀏覽一瓶價值238元的長城干紅葡萄酒信息。
標簽:紅酒,長城
時間:因為是昨天的行為,假設衰減因子為:r=0.95
行為類型:瀏覽行為記為權重1
地點:品尚紅酒單品頁的網址子權重記為 0.9(相比京東紅酒單品頁的0.7)
假設用戶對紅酒出於真的喜歡,才會去專業的紅酒網選購,而不再綜合商城選購。
則用戶偏好標簽是:紅酒,權重是0.95*0.7 * 1=0.665,即,用戶A:紅酒 0.665、長城 0.665。
上述模型權重值的選取只是舉例參考,具體的權重值需要根據業務需求二次建模,這里強調的是如何從整體思考,去構建用戶畫像模型,進而能夠逐步細化模型。