效度研究	相同点	不同点
词汇复杂度		s 三项考试词汇复杂度各项指标均有显著差异(BNC型符、类符除外)，托福词汇难度最高，雅思其次，六级最低；相反，六级词汇多样性最高，雅思其次，托福最低。
文本选择与改编	s 六级、雅思阅读测试选材话题覆盖面较广，且都选自原版杂志、报刊、学术书籍，语言真实性强。 s 六级、雅思阅读文本改编方式多样。两项测试文本改编前后在BNC1000词、范围外词、隐性衔接指标、二语可读性指标改革前后均有显著差异。	s 六级选材更青睐英语国家讨论国际时事的主流杂志与报纸，而雅思阅读文本大多选自关注科学技术发展或学术研究问题的书籍与学术性杂志。 s 雅思改编前后多项文本特征指标没有显著性差异，而六级改编后很多文本性特征(词汇、句法、显性衔接、文本抽象性、Flesh易读度)有显著差异。
听力长对话构念	s 三项考试听力长对话主要测量了语法知识和认知策略及部分元认知策略，说明三项考试的构念效度较好。 s 三项考试听力长对话都未测量语用知识和社会语言知识，且都有构念无关知识和构念无关策略使用，对三项听力长对话的构念都形成了一定威胁。	s 托福构念的无关知识比例最高，六级其次，雅思最低。 s 托福听力长对话构念无关因素还涉及阅读策略。
阅读构念	s 三项考试均考查了单句、句间和段落三个信息层面的知识，且考查比例均按单句、句间和段落依次递减；三项考试都考查了受试理解细节、理解大意和推断的能力，表明三项考试均注重考查考生是否理解阅读材料并能读出言外之意。 s 三项考试受试的答题过程与预期答题操作的拟合度高，说明三项阅读测试均有较好的构念效度。 s 三项考试受试都有不同程度的不符合答题预期操作却选对正确答案、或理解错误却选对答案、或推理解释不清却选对答案的情况，说明存在对构念无关信息或技能的使用，这对三项考试的构念形成了一定威胁。	s 托福受试答题过程使用排除法的比例最高，六级理解错误但答对题的比例最高，雅思推理解释不清但答对题的比例最高。
会话特征	s 三项口语测试考官和考生都表现出较为丰富的话轮转换关联位置特征，均能使用多样化的话轮保持方式，且都能提供话轮。 s 三项口语测试都基本按照一问一答的序列结构展开，且大都按照毗邻语对的形式展现。 s 三项口语测试考官和考生都没有体现他人修正和他人启动–自我修正。	s 雅思考官和考生表现出的话轮转换关联位置特征和比邻语对最丰富，六级、托福其次。 s 雅思考官会发起自我启动–自我修正；雅思考生和托福考生同样会发起自我启动–自我修正，但是六级考生未发起自我启动–自我修正。