维度1

逻辑性(Logical Coherence): 检查模型生成的对话是否有逻辑一致性,即回答是否紧密相关,是否形成连贯的对话链。

维度2

信息准确性(Information Accuracy): 检查模型生成的回答是否准确,是否提供正确的信息,避免误导用户。

维度3

上下文理解(Context Understanding): 评估模型对对话上下文的理解程度,检查模型是否正确捕捉先前对话中的信息,并在回答中保持上下文的连贯性。

维度4

多轮对话处理(Multi-turn Dialogue Handling): 对多轮对话进行评估,检查模型在处理多轮对话时是否能够有效维持对话的连贯性,并正确理解用户的意图。

维度5

情感表达(Emotional Expression): 评估模型是否能够适当地表达情感,以确保对话在情感上更加生动丰富。

维度6

自然度(Naturalness): 评估模型生成的对话是否自然、流畅,是否符合日常英语表达的语法和用词习惯。

维度7

主动性(Proactiveness): 评估模型是否能够主动提供有用的信息或建议,而不仅仅是回答用户提出的问题。

维度8

语气和礼貌(Tone and Politeness): 检查模型回答的语气和礼貌程度,确保对话中的交流方式符合社交礼仪。