2010
07.13

好久没写blog,把最近的经验总结总结。

在市场研究中,我们经常需要对市场、用户细分,做不同的用户角色,用得最多的就是聚类分析了。不过这种方法属于探索性分析,需要分析人员非常了解业务,并且知识如何运用聚类的结果,才能高效地分析出有效的结果。

SORRY,我不谈具体分析的技术细节,比如标准化,用相似性算法还是距离的算法,那些不重要,重要的是与业务结合的分析思路——结果导向。

在聚类分析中,最关键的就是聚类变量的选择与样本的代表性,其它什么正态分布之类的东东没意义,唯一一个问题就是不能有高度的相关,否则只是给一个变量赋上了更多的权重而已,如果有这种情况,——我们先对变量聚类,或者用因子分析来解决,找到关键变量,然后选择关键的变量来对个体聚类,最终达到我们的目的——细分用户与市场。

好吧,谈谈变量的选择。假设我要对某微博的用户做细分,指导产品的设计与推广,那么我需要怎样采集数据?

第一,明确细分的标准——用来聚类变量是什么?

如果你了解业务,就会知道,我们更多地用需求特征来对用户分类。比如文本内容偏好——生活?记录?还是其它?图片发表量?转发量?

有时候,我们还会用与行为变量高度相关的态度变量,一起作为聚类的变量,这样整个模型就更完整。

第二,用户对不同设计效果的态度、用户来源的渠道。

因为我要指导产品的设计,我就要知道这些用户喜欢什么色彩了,什么风格的设计。分类完成好,我需要用这些数据来检验聚类的结果——聚类结果与其它变量交叉分析,

又比如去做对应分析,不同的类别离原点越远越好。如果聚类的群体之间行为、态度、人口特征不明显,那说明聚类结果不OK。

这里简单提一下TGI(目标群体指数分析),当群体的变一变量的比例与总体的比例差异超过15%(也有人认为是20%),那么就认为差异是显著的。

为什么要差异显著呢?因为这样才会对业务有指导意义。

以上都是野路子,欢迎探讨:)至于技术细节,百度去!!

偶的email:huangzhe.84@gmail.com

暂无回复

添加回复
(测试中)用'@user空格'可通知其Ta评论者,user的大小写得一致