维度1	逻辑性(Logical Coherence)：检查模型生成的对话是否有逻辑一致性，即回答是否紧密相关，是否形成连贯的对话链。
维度2	信息准确性(Information Accuracy)：检查模型生成的回答是否准确，是否提供正确的信息，避免误导用户。
维度3	上下文理解(Context Understanding)：评估模型对对话上下文的理解程度，检查模型是否正确捕捉先前对话中的信息，并在回答中保持上下文的连贯性。
维度4	多轮对话处理(Multi-turn Dialogue Handling)：对多轮对话进行评估，检查模型在处理多轮对话时是否能够有效维持对话的连贯性，并正确理解用户的意图。
维度5	情感表达(Emotional Expression)：评估模型是否能够适当地表达情感，以确保对话在情感上更加生动丰富。
维度6	自然度(Naturalness)：评估模型生成的对话是否自然、流畅，是否符合日常英语表达的语法和用词习惯。
维度7	主动性(Proactiveness)：评估模型是否能够主动提供有用的信息或建议，而不仅仅是回答用户提出的问题。
维度8	语气和礼貌(Tone and Politeness)：检查模型回答的语气和礼貌程度，确保对话中的交流方式符合社交礼仪。