字节跳动开源Seed-X 7B多语言翻译模型:28语种全覆盖
字节跳动开源Seed-X 7B多语言翻译模型:28语种全覆盖,性能超越GPT-4、Gemini-2.5与Claude-3.5
LM Studio 中下载 Sangto/Seed-X-PPO-7B-Q8_0-GGUF。机器显存>8G,就可以翻译了。
一、
Seed-X 是一套由字节跳动开源的多语言翻译模型家族,包含三大核心组件:
Seed-X-Instruct:指令微调模型,用于增强模型对用户翻译指令的理解与执行;
Seed-X-PPO:基于强化学习(Proximal Policy Optimization)的翻译增强模型,通过人类反馈奖励与自动评价指标联合优化,进一步提升翻译质量;
Seed-X-RM:奖励模型(Reward Model),用于对候选翻译结果进行打分,为 PPO 训练提供信号。
二、
Seed-X 支持以下 28 种语言的双向互译,涵盖全球主要语种:
| Languages | Abbr. | Languages | Abbr. | Languages | Abbr. | Languages | Abbr. | 
|---|---|---|---|---|---|---|---|
| Arabic | ar | French | fr | Malay | ms | Russian | ru | 
| Czech | cs | Croatian | hr | Norwegian Bokmal | nb | Swedish | sv | 
| Danish | da | Hungarian | hu | Dutch | nl | Thai | th | 
| German | de | Indonesian | id | Norwegian | no | Turkish | tr | 
| English | en | Italian | it | Polish | pl | Ukrainian | uk | 
| Spanish | es | Japanese | ja | Portuguese | pt | Vietnamese | vi | 
| Finnish | fi | Korean | ko | Romanian | ro | Chinese | zh | 
在互联网、科技、办公对话、电子商务、生物医药、金融、法律、文学、娱乐等领域,Seed-X 均展现了卓越的翻译质量,满足跨行业、多场景的落地需求。
https://cloud.tencent.com/developer/article/2543952
三、
28种语言列表
| 语言(中文) | 语言(英文) | 缩写 | 
|---|---|---|
| 阿拉伯语 | Arabic | ar | 
| 捷克语 | Czech | cs | 
| 丹麦语 | Danish | da | 
| 德语 | German | de | 
| 英语 | English | en | 
| 西班牙语 | Spanish | es | 
| 芬兰语 | Finnish | fi | 
| 法语 | French | fr | 
| 克罗地亚语 | Croatian | hr | 
| 匈牙利语 | Hungarian | hu | 
| 印尼语 | Indonesian | id | 
| 意大利语 | Italian | it | 
| 日语 | Japanese | ja | 
| 韩语 | Korean | ko | 
| 马来语 | Malay | ms | 
| 荷兰语 | Dutch | nl | 
| 挪威博克马尔 | Norwegian Bokmal | nb | 
| 挪威语 | Norwegian | no | 
| 波兰语 | Polish | pl | 
| 葡萄牙语 | Portuguese | pt | 
| 罗马尼亚语 | Romanian | ro | 
| 俄语 | Russian | ru | 
| 瑞典语 | Swedish | sv | 
| 泰语 | Thai | th | 
| 土耳其语 | Turkish | tr | 
| 乌克兰语 | Ukrainian | uk | 
| 越南语 | Vietnamese | vi | 
| 中文 | Chinese | zh |