清华北航博士生「强迫」Gemma-2 说中文!弱智吧、角色扮演、数学问题表现惊喜
2024-07-09 18:14:05 AI 246观看
摘要 【新智元导读】谷歌的 Gemma 2 刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。众所周知,很多国外 LLM 一直

【新智元导读】谷歌的 Gemma 2 刚刚发布,清华和北航的两名博士生就已经成功推出了指令微调版本,显著增强了 Gemma 2 9B / 27B 模型的中文通用对话、角色扮演、数学、工具使用等能力。GZy28资讯网——每日最新资讯28at.com

众所周知,很多国外 LLM 一直存在非英语歧视问题,英语和其他语言在 LLM 中存在的性能差距有时可以用悬殊来形容。GZy28资讯网——每日最新资讯28at.com

之前就有网友发现,GPT-4o 分词器语料库中,中文数据污染非常严重,赌博色情网站是一个也不少,严重影响了我们用中文和 AI 机器人好好聊天。GZy28资讯网——每日最新资讯28at.com

最近发布的 Gemma 2 模型虽然既开源又强悍,但比较遗憾的是,其中文水平相较英文水平还有一定的距离。GZy28资讯网——每日最新资讯28at.com

不过,我们可以用微调来解决,Fine-tune it!GZy28资讯网——每日最新资讯28at.com

7 月 1 日,Gemma 2 刚发布 4 天,清华大学的一名人工智能博士生王慎执就在 X 上隆重推出了一款微调模型 Gemma-2-9B-Chinese-Chat。GZy28资讯网——每日最新资讯28at.com

GZy28资讯网——每日最新资讯28at.com

郑耀威GZy28资讯网——每日最新资讯28at.com

郑耀威目前仍在北航读博,他曾以第一作者在 CVPR、AAAI、WWW 等顶会发表多篇论文,并担任 AAAI、EMNLP、Neural Computation 等会议和期刊审稿人。GZy28资讯网——每日最新资讯28at.com

他也是大模型微调框架 LLaMA Factory 的发起人和主要开发者,GitHub 开源项目获得超过 2 万星标。GZy28资讯网——每日最新资讯28at.com

在这些优秀的贡献者的不断努力之下,开源模型之路会越走越宽广,模型的中文能力也会逐渐增强。GZy28资讯网——每日最新资讯28at.com

参考资料:GZy28资讯网——每日最新资讯28at.com

https://x.com/ShenzhiWang_THU/status/1807640624402923779GZy28资讯网——每日最新资讯28at.com

https://huggingface.co/shenzhi-wang/Gemma-2-9B-Chinese-ChatGZy28资讯网——每日最新资讯28at.com

https://huggingface.co/shenzhi-wang/Gemma-2-27B-Chinese-ChatGZy28资讯网——每日最新资讯28at.com

本文来自微信公众号:新智元(ID:AI_era)GZy28资讯网——每日最新资讯28at.com

本文链接:http://www.28at.com/showinfo-45-5050-0.html清华北航博士生「强迫」Gemma-2 说中文!弱智吧、角色扮演、数学问题表现惊喜

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:OpenAI 公司被指不重视安全,未披露和报告 2023 年入侵事件

下一篇:快手可灵 AI 网页端上线:所有功能限时免费,单次视频生成时长增至 10 秒

最新热点