处理步骤及方法

采取方法

单纯的计算机处理

直接对地址进行模糊匹配;

基于中文分词、结巴分词和词向量技术进行地址关联;

基于正则表达式的确定状态自动机的精确匹配

基于小区的计算机处理

通过分类算法将剩余数据按小区分类,基于小区的经纬度、户数、楼号等维度,按模块进行条件概率下的双向检索与判定,快速实现数据的分析、预测、关联与整合

基于用户信息的数据关联

通过用户姓名、电话和购气记录信息进行异源异构的数据关联

人工处理

人工校对后执行前两步分析处理