阿里国际AI团队最新研发的翻译大模型Marco于今日正式上线。该模型基于开源数据集Flores,支持中、英、日、韩、西、法等15种全球主流语种。根据BLEU自动评测指标,在翻译质量上领先于市场上的标杆产品,如Google翻译、DeepL、GPT-4等。
举例来说,过去一些AI翻译产品会对“你的宝贝正在路上”进行错误的翻译,“Your baby is on the way”会被误译为“Zundu likes it”。而在Marco大模型中,这句话得以非常地道地翻译成“I really like it”。
据了解,Marco翻译大模型通过多语言的数据筛选技术(如多语种混合语料甄别、多维度数据质量评估)获得了高质量和大规模的多语言数据,并结合了混合专家和参数扩张方法,在保证主导语言(如中、英)性能不下降的情况下提升了其他语种的质量。
对于个人用户而言,Marco能够提供高质量的翻译和良好的可读性,并且还支持不同的翻译风格,以满足个人多样化的翻译需求。
评论