【新智元导读】谷歌的 Gemma 2 刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。
众所周知,很多国外 LLM 一直存在非英语歧视问题,英语和其他语言在 LLM 中存在的性能差距有时可以用悬殊来形容。
之前就有网友发现,GPT-4o 分词器语料库中,中文数据污染非常严重,赌博色情网站是一个也不少,严重影响了我们用中文和 AI 机器人好好聊天。
最近发布的 Gemma 2 模型虽然既开源又强悍,但比较遗憾的是,其中文水平相较英文水平还有一定的距离。
不过,我们可以用微调来解决,Fine-tune it!
7 月 1 日,Gemma 2 刚发布 4 天,清华大学的一名人工智能博士生王慎执就在 X 上隆重推出了一款微调模型 Gemma-2-9B-Chinese-Chat。
郑耀威
郑耀威目前仍在北航读博,他曾以第一作者在 CVPR、AAAI、WWW 等顶会发表多篇论文,并担任 AAAI、EMNLP、Neural Computation 等会议和期刊审稿人。
他也是大模型微调框架 LLaMA Factory 的发起人和主要开发者,GitHub 开源项目获得超过 2 万星标。
在这些优秀的贡献者的不断努力之下,开源模型之路会越走越宽广,模型的中文能力也会逐渐增强。
参考资料:
https://x.com/ShenzhiWang_THU/status/1807640624402923779
https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-Chat
https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-Chat
本文来自微信公众号:新智元(ID:AI_era)
本文链接:http://www.28at.com/showinfo-45-5050-0.html清华北航博士生「强迫」Gemma-2 说中文!弱智吧、角色扮演、数学问题表现惊喜
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。