测试各种 LLM 对华文网路流行语言的翻译能力

随性比较了多个开放权重的大型语言模型特别在华文网路流行语言上的表现，并分别使用准确分和效率分两个指标进行排序。

测试 Prompt

统一指令：请将以下中文句子翻译成英文。

每个模型有两个基础指标：准确分 Q和参数量 R（单位 Billion）。
采用人工评价是否整句正确，整句正确则积一分，然后按照正确率的值乘以 100 记为准确分。效率分的计算方法如下：

下图为按准确分排序的结果：

按准确分排序的模型表现图

下图为按效率分排序的结果：

按效率分排序的模型表现图