算法2:基于EWH的最近邻搜索算法 |
输入:一个生物查询数据 ,索引数据表 ,一组权重 ,相似度阈值 |
输出:查询 的最近邻 |
1) 初始化数据库中的所有数据分数为0 |
2) 对于每一个 ,计算 ,并将(行,列)值等于 的所有数据赋值为 |
3) 对于误差r从1到e,计算集合 ,其中 是与 有r比特误差的向量 |
4) 将(行,列)值等于 的所有数据分数增加 |
5) 当所有的 遍历完上述步骤后,都被赋予了一定的分数。我们选择分数大于β的数据作为最近邻候选者 |
6) 最后穷举所有的最近邻候选者,计算它们的汉明距离并返回最近邻 |