k-means聚类特征

离散值

说明

用户ID

U i

用户ID

店铺ID

S j

店铺ID

支付宝使用次数(C1)

C 1 = c ( c N* ) .

用户 U i 在店铺 S j 支付及浏览总次数。

用户平均每次使用金额(C21)与店铺平均使用金额(C22)的差值(C2)

C 2 = C 21 C 22

其中 C 21 = k =1 N per_pay pay_time k N , C 22 = per_pay .

pay_time k 为用户 U i 在第k时间点下在店铺 S j 的支付次数,N为用户 U i 在不同时间点下在店铺 S j 的支付次数。

平均多长时间购买该店铺商品(C3)

C 3 = k =2 n pay_time k pay_time k 1 n .

n为用户 U i 在不同时间点下在店铺 S j 的支付次数, pay_time k 表示用户 U i 在第k个在店铺 S j 支付的时间点。

店铺评论数量(C4)

C 4 = comment_cnt .

comment_cnt的数值越大代表评论数量越多

店铺评分(C5)

C 5 = score ( score { 0 , 1 , 2 , 3 , 4 , 5 } ) .

score的数值越大代表评分越高

店铺类型(C6)

C 6 = cate_id .

cate_id的具体表示方法见章节3.1数据预处理。

店铺档次(C7)

C 7 = shop_level ( shop_level { 1,2,3 } ) .

1表示低档,2表示中档,3表示高档。