输入:包含现有关系指示词库中关键词的语句集合,

输出:经过扩充以后的关系指示词库

过程:

For each 语句集合 set

2. For each 关键词 k ∈ 关键词词库

3. For each 两个包含了同一个 k 且包含两个以上公司名称的不同语句 S1, S2

4. 寻找两个句子中的公共词组

5. 进行去停用词操作

将去停用词以后的关键词词组保存进备选词库,并计算出现频率

7. For each 备选词 word

8. IF word 出现频率大于0.3 THEN

9. 把该词添加到关系指示词库

10. END IF

1 End for

12. End for

13. End for

14. End for