处理步骤及方法 | 采取方法 |
单纯的计算机处理 | 直接对地址进行模糊匹配; |
基于中文分词、结巴分词和词向量技术进行地址关联; | |
基于正则表达式的确定状态自动机的精确匹配 | |
基于小区的计算机处理 | 通过分类算法将剩余数据按小区分类,基于小区的经纬度、户数、楼号等维度,按模块进行条件概率下的双向检索与判定,快速实现数据的分析、预测、关联与整合 |
基于用户信息的数据关联 | 通过用户姓名、电话和购气记录信息进行异源异构的数据关联 |
人工处理 | 人工校对后执行前两步分析处理 |