深度求索公司近期推出了其最新版本的人工智能模型——DeepSeek-V3.1。据官方介绍,该版本采用了创新的UE8M0 FP8 Scale参数精度,这一技术是为即将面世的国产新一代芯片特别设计的。
DeepSeek-V3.1在功能上进行了多项重要升级。首先,它引入了混合推理架构,使得一个模型能够同时支持思考模式与非思考模式,这一改变大大增强了模型的灵活性。其次,在思考效率方面,相较于之前的版本DeepSeek-R1-0528,DeepSeek-V3.1-Think能够在更短的时间内提供答案,提升了工作效率。新模型还通过Post-Training优化技术,显著增强了Agent能力,在工具使用和智能体任务中的表现均有大幅提升。
值得注意的是,深度求索公司已同步更新了其官方App和网页端的模型至DeepSeek-V3.1版本,用户将能够体验到这些全新的功能和改进。
举报 0收藏 0打赏 0评论 0分享 0 更多>同类资讯谷歌Gemini大模型能耗揭秘:每次回答仅耗微波炉1秒电量08-22
vivo三十周年:发布轻便MR头显,影像生态战略全面革新正值企业三十周年之际,vivo不仅重磅发布了混合现实头显探索版,还宣布了影像技术战略及影像文化生态的全新布局,并揭晓了2025 vivo影像加手机摄影大赛结果。作为国内首家同时布局手机与MR的科技企业,viv…08-22
霄云科技发布银河存储,专为AI场景打造,重塑企业级存储性能标杆这款专为人工智能模型训练、高性能计算(HPC)、生命科学等场景设计的存储系统,以“极速、高可用、全链路可视”为核心,重新定义企业级存储的性能边界。▪ 支持百万级IOPS与微秒级延迟,通过并行文件系统与IB…08-22
中国移动安徽公司:信息技术引领低空经济,打造城市运行新引擎在芜湖市低空监管平台一体化项目中,中国移动安徽公司以“四驱两翼”低空能力体系为核心,率先实现5G网络作为无人机通信与控制链路的创新应用。从医疗物资运输到应急响应,从跨区域协同到多场景覆盖,中国移动以网络为桥、…08-22
恒扬数据:多芯异构技术引领,打造智算时代中心到边缘的完整解决方案依托基于FPGA的DPU架构在可编程灵活性、并行处理能力及低时延等方面的技术优势,恒扬数据已构建起覆盖从中心节点到边缘端侧的完整算力产品和解决方案,通过与行业头部企业的深度合作,在安全、互联网、运营商等垂直领…08-22
牛津大学揭秘大型语言模型“深度诅咒”,层归一化缩放技术成破解关键这个名字非常形象,因为它揭示了当前大型语言模型训练中的一个根本性矛盾:我们投入巨大的计算资源来训练更深的模型,期望获得更强的能力,但实际上,越深的层级对模型的贡献越小,就像被某种无形的诅咒束缚住了一样。 面对…08-22
字节跳动Seed团队开源推理大模型,Seed-OSS系列斩获7项SOTA成绩智东西8月21日报道,今天,字节跳动Seed团队开源了Seed-OSS系列模型,这些模型专为长上下文、推理、Agent和通用场景设计,将上下文窗口扩展至512k,是业界常见上下文窗口(128k)的4倍,GP…08-22
vivo三十周年:发布轻量MR头显,影像生态战略全面革新正值企业三十周年之际,vivo不仅重磅发布了混合现实头显探索版,还宣布了影像技术战略及影像文化生态的全新布局,并揭晓了2025 vivo影像加手机摄影大赛结果。作为国内首家同时布局手机与MR的科技企业,viv…08-22
vivo胡柏山:MR技术引领家庭机器人时代,共筑智能生活新愿景胡柏山在阐述vivo科技战略蓝图时提到:“我们致力于通过手机AI、影像和MR能力,短期满足用户对大屏沉浸感的需求,长远作为机器人的眼睛和大脑,攻克家庭这一非结构化场景下的‘感知-决策’难题,搭建未来家庭机器人…08-22
百度Q2财报:广告业务下滑,AI新业务成业绩增长新动力百度新任CFO何海建在此次电话会上称,在过去的几个季度里,百度加大了AI投资力度,但由于AI搜索的商业化仍处于非常早期的阶段,尚未扩大规模,预计百度的收入和利润率在短期内面临相当大的压力,第三季度将特别具有…08-22
文远知行WePilot AiDrive:年内量产,引领L2级辅助驾驶新革命08-22
文远知行WePilot AiDrive:年内量产,引领L2级辅助驾驶新纪元08-22
AI陪伴市场升温,雷军马斯克等资本大佬入局,长期记忆痛点待解郭戈称,资本追逐这一赛道并非偶然,因为陪伴本身就是玩具的核心价值,而AI的加入则赋予其“情绪价值”,扩大了市场蛋糕。 万物时创始人万一(Roy)也向时代周报记者强调,“情感陪伴一定是长期的本质需求,和文化消费…08-22
智汇教育未来:名校长共探基础教育数字化变革新航向来自全国多地的名校长与专家学者齐聚一堂,围绕基础教育数字化变革、学校数字转型与智能升级、校长数字化领导力等核心议题,深入交流联盟内外部实践经验,共话智慧教育发展新路径。 论坛由教育数字化行动百校联盟联合北京师…08-22生成式AI投资热,但95%企业未见回报,AI价值何在?08-22点击查看更多 +全站最新
第四届数贸会:AI前沿技术汇聚,沉浸式体验探索智能新生态
AMD发布FidelityFX SDK 2.0及FSR 4.0.2,铺路FSR Redstone神经渲染技术
李斌:汽车行业无终点,蔚来与特斯拉同处稚嫩期需持续奋斗
泡泡玛特市值飙升,王宁个人财富超越马云成新焦点
一汽与零跑深化合作,或收购零跑10%股份共谋发展
蔚来电池降价两万,消费者购车成本直降,销量压力下的市场策略?热门内容
vivo三十周年:发布轻便MR头显,影像生态战略全面革新
霄云科技发布银河存储,专为AI场景打造,重塑企业级存储性能标杆
中国移动安徽公司:信息技术引领低空经济,打造城市运行新引擎
恒扬数据:多芯异构技术引领,打造智算时代中心到边缘的完整解决方案
牛津大学揭秘大型语言模型“深度诅咒”,层归一化缩放技术成破解关键
字节跳动Seed团队开源推理大模型,Seed-OSS系列斩获7项SOTA成绩
本文链接:http://www.28at.com/showinfo-45-26812-0.htmlDeepSeek-V3.1发布:采用UE8M0 FP8精度,专为下一代国产芯片设计
声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。