清华北航博士生「强迫」Gemma-2 说中文！弱智吧、角色扮演、数学问题表现惊喜-28资讯网—

清华北航博士生「强迫」Gemma-2 说中文！弱智吧、角色扮演、数学问题表现惊喜

2024-07-09 18:14:05 AI 359观看

摘要【新智元导读】谷歌的 Gemma 2 刚刚发布，清华和北航的两名博士生就已经成功推出了指令微调版本，显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。众所周知，很多国外 LLM 一直

【新智元导读】谷歌的 Gemma 2 刚刚发布，清华和北航的两名博士生就已经成功推出了指令微调版本，显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。

众所周知，很多国外 LLM 一直存在非英语歧视问题，英语和其他语言在 LLM 中存在的性能差距有时可以用悬殊来形容。

之前就有网友发现，GPT-4o 分词器语料库中，中文数据污染非常严重，赌博色情网站是一个也不少，严重影响了我们用中文和 AI 机器人好好聊天。

最近发布的 Gemma 2 模型虽然既开源又强悍，但比较遗憾的是，其中文水平相较英文水平还有一定的距离。

不过，我们可以用微调来解决，Fine-tune it！

7 月 1 日，Gemma 2 刚发布 4 天，清华大学的一名人工智能博士生王慎执就在 X 上隆重推出了一款微调模型 Gemma-2-9B-Chinese-Chat。

郑耀威

郑耀威目前仍在北航读博，他曾以第一作者在 CVPR、AAAI、WWW 等顶会发表多篇论文，并担任 AAAI、EMNLP、Neural Computation 等会议和期刊审稿人。

他也是大模型微调框架 LLaMA Factory 的发起人和主要开发者，GitHub 开源项目获得超过 2 万星标。

在这些优秀的贡献者的不断努力之下，开源模型之路会越走越宽广，模型的中文能力也会逐渐增强。

参考资料：

https://x.com/ShenzhiWang_THU/status/1807640624402923779

https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-Chat

https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-Chat

本文来自微信公众号：新智元（ID：AI_era）

本文链接：http://www.28at.com/showinfo-45-5050-0.html清华北航博士生「强迫」Gemma-2 说中文！弱智吧、角色扮演、数学问题表现惊喜

声明：本网页内容旨在传播知识，不代表本站观点，若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

显示全文

最新热点