给出一个特征f = {s1,s2,...sn}

令L为序列si的最长长度

连接s1,s2,...sn构成S

对1到n_iter做如下循环

开始索引ki:随机数,ki<序列S的长度-L + 1

移动长度li:随机数,li < L

序列S 从位置ki移动到ki + li-1的子序列记为Sti

f’表示由特征中每个序列与子序列Sti的编辑距离组成的特征向量

IGi(f’)表示特征向量f’的信息增益

循环结束

返回信息增益最大所对应的子序列STi