零一万物开源全新Yi-9B模型:代码与数学能力出众,超越多个同类模型
2024-03-18 09:37:53 AI 240观看
摘要3月7日消息,近日,“零一万物01AI”官方公众号发布消息,宣布其已成功开源名为Yi-9B的全新模型。该模型被誉为Yi系列中的“理科状元”,在代码和数学能力上展现出卓越实力,成为目前Yi系列模型中的佼佼者。据悉,Yi-9B模型的实际

3月7日消息,近日,“零一万物01AI”官方公众号发布消息,宣布其已成功开源名为Yi-9B的全新模型。该模型被誉为Yi系列中的“理科状元”,在代码和数学能力上展现出卓越实力,成为目前Yi系列模型中的佼佼者。qUz28资讯网——每日最新资讯28at.com

qUz28资讯网——每日最新资讯28at.com

据悉,Yi-9B模型的实际参数达到了8.8B,默认上下文长度更是高达4Ktokens。这款模型在Yi-6B的基础上进行了进一步的训练和优化,使用了0.8T tokens的数据进行精细调整,训练数据截至2023年6月。qUz28资讯网——每日最新资讯28at.com

qUz28资讯网——每日最新资讯28at.com

在综合能力方面,Yi-9B模型表现出色,超越了众多同尺寸的开源模型,如DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B和Gemma-7B等。在代码能力上,Yi-9B仅次于DeepSeek-Coder-7B,但超越了Yi-34B、SOLAR-10.7B、Mistral-7B和Gemma-7B等众多竞争对手。同时,在数学能力方面,Yi-9B也展现出强大的实力,仅次于DeepSeek-Math-7B,超越了SOLAR-10.7B、Mistral-7B和Gemma-7B等模型。qUz28资讯网——每日最新资讯28at.com

qUz28资讯网——每日最新资讯28at.com

Yi-9B在常识和推理能力方面也表现出不俗的水平,与Mistral-7B、SOLAR-10.7B和Gemma-7B等模型不相上下。此外,官方还特别强调,无论是Yi-9B(BF16)还是其量化版Yi-9B(Int8),都能够在消费级显卡上实现轻松部署,大大降低了使用成本,对开发者来说非常友好。qUz28资讯网——每日最新资讯28at.com

据ITBEAR科技资讯了解,零一万物公司由李开复创新工场董事长兼CEO带队创办,此前已经成功推出了Yi-34B和Yi-6B两个开源大模型。该公司表示,他们对学术研究完全开放,并同步开放免费商用申请,以推动人工智能技术的广泛应用和发展。qUz28资讯网——每日最新资讯28at.com

标签:零一万物
免责声明:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其内容真实性、完整性不作任何保证或承诺。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。
举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
苹果新专利曝光:Apple Watch将配备多功能环境传感器
苹果新专利曝光:Apple Watch将配备多功能环境传感器
CeMeta森宇宙发布营销大模型,开启家电及家居AI营销新时代
CeMeta森宇宙发布营销大模型,开启家电及家居AI营销新时代
苹果收购DarwinAI,加强AI领域布局
苹果收购DarwinAI,加强AI领域布局
大众汽车加速电动化布局,计划2027年前推出11款全新电动车型
大众汽车加速电动化布局,计划2027年前推出11款全新电动车型
Forte停产让路,起亚K4预告图抢先看,C柱设计成亮点
Forte停产让路,起亚K4预告图抢先看,C柱设计成亮点
保时捷Taycan Turbo GT刷新纽伯格林电动轿车纪录,领先特斯拉17秒
保时捷Taycan Turbo GT刷新纽伯格林电动轿车纪录,领先特斯拉17秒
热门内容
  • OpenAI发布Sora模型:文本秒变视频,AI创作再升级
  • OpenAI发布Sora模型:可根据文本生成多视角视频,电影行业或受冲击
  • 渲染1小时仅出1分钟!OpenAI视频生成模型Sora遭质疑?
  • 李彦宏谈百度文心一言4.0:中文超越ChatGPT,英文仍需努力
  • 百度CEO李彦宏:未来或不再需要专业程序员,语言即编程
  • 字节跳动推出创新视频模型Boximator:文本精确控制动作
  • 特斯拉Optimus人形机器人再进化,步行能力大幅提升
  • 阿里巴巴秘密武器“绘蛙”曝光,AI电商时代再掀波澜
  • ChatGPT日耗电超50万千瓦时,AI能耗问题引关注
  • Anthropic发布Claude 3系列:大型语言模型的新标杆
  • 微软Copilot聊天机器人上线新功能:“笔记本”支持高达18000字符
  • 谷歌开源新工具Magika:基于AI高效识别文件格式和内容
  • 黄仁勋力荐:Perplexity AI成研究新宠
  • OpenAI发布Sora文生视频大模型,清华大学亦有新专利公布
  • Reddit与神秘AI巨头达成数据授权协议,年价值约4.32亿元人民币
本栏最新
Cerebras发布第三代芯片WSE-3:性能翻倍,助力大模型训练
Cerebras发布第三代芯片WSE-3:性能翻倍,助力大模型训练
谷歌DeepMind推出SIMA模型:打造更贴近人类的游戏智能队友
谷歌DeepMind推出SIMA模型:打造更贴近人类的游戏智能队友
OpenAI疑似泄露GPT-4.5 Turbo模型信息
OpenAI疑似泄露GPT-4.5 Turbo模型信息
京东推出全新“AI全能服务包”,助力商家降低50%运营成本
京东推出全新“AI全能服务包”,助力商家降低50%运营成本
李彦宏谈百度文心一言4.0:中文超越ChatGPT,英文仍需努力
李彦宏谈百度文心一言4.0:中文超越ChatGPT,英文仍需努力
百度CEO李彦宏:未来或不再需要专业程序员,语言即编程
百度CEO李彦宏:未来或不再需要专业程序员,语言即编程

本文链接:http://www.28at.com/showinfo-45-3577-0.html零一万物开源全新Yi-9B模型:代码与数学能力出众,超越多个同类模型

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:权力争斗后,阿尔特曼重返 OpenAI 董事会

下一篇:Anthropic发布Claude 3系列:大型语言模型的新标杆

最新热点