各大AI厂商要确定其AI的能力,都会提供一些独立的测试评分。市场上有不少相关的测试平台,热门的有OpenCompass丶ARC基准测试丶HellaSwag基准测试等等,中国则有大模型测评机构SuperCLUE等。香港大学经管学院也加入成为测试员,并发 ...