Python Data Science: User Profiling in Data Analysis

How to do user profiling and user segmentation

Posted by Mengran on August 16, 2021

User Profiling

User Profiling Modeling:

  • First Step: Unifying users 统一化
  • Second Step: Segmentation 标签化
  • Third Step: Business Operation 业务化

1.Unifying Users

用户唯一标识是整个用户画像的核心。

我们以一个 App 为例,它把“从用户开始使用 APP 到下单到售后整个所有的用户行为”进行串联,这样就可以更好地去跟踪和分析一个用户的特征。

设计唯一标识可以从这些项中选择:用户名、注册手机号、联系人手机号、邮箱、设备号、CookieID 等。

2.Users Segmentation

用户消费行为分析从4 个维度来进行标签划分:

  • 用户标签:它包括了性别、年龄、地域、收入、学历、职业等。这些包括了用户的基础属性。
  • 消费标签:消费习惯、购买意向、是否对促销敏感。这些统计分析用户的消费习惯。
  • 行为标签:时间段、频次、时长、访问路径。这些是通过分析用户行为,来得到他们使用 App 的习惯。
  • 内容分析:对用户平时浏览的内容,尤其是停留时间长、浏览次数多的内容进行分析,分析出用户对哪些内容感兴趣,比如,金融、娱乐、教育、体育、时尚、科技等。

用户画像是现实世界中的用户的数学建模,我们正是将海量数据进行标签化,来得到精准的用户画像,从而为企业更精准地解决问题。

3.Business Value

从用户生命周期的三个阶段来划分业务价值,包括:获客、粘客和留客。

  • 获客:如何进行拉新,通过更精准的营销获取客户。
  • 粘客:个性化推荐,搜索排序,场景运营等。
  • 留客:流失率预测,分析关键节点降低流失率。

如果按照数据流处理的阶段来划分用户画像建模的过程,可以分为数据层、算法层和业务层。你会发现在不同的层,都需要打上不同的标签:

  • 数据层指的是用户消费行为里的标签。我们可以打上“事实标签”,作为数据客观的记录。包括: 用户属性,投诉次数,产品购买次数,渠道使用频率,访问时长,浏览内容频次,支付渠道使用,优惠券使用等。
  • 算法层指的是透过这些行为算出的用户建模。我们可以打上“模型标签”,作为用户画像的分类标识。包括: 用户兴趣,用户活跃度,用户满意度,产品购买偏好,用户关联关系,渠道使用偏好,支付使用偏好,优惠券偏好等。
  • 业务层指的是获客、粘客、留客的手段。我们可以打上“预测标签”,作为业务关联的结果。包括获客预测,个性化推荐,GMV趋势预测,用户流失概率。

标签化的流程,就是通过数据层的“事实标签”,在算法层进行计算,打上“模型标签”的分类结果,最后指导业务层,得出“预测标签”。