文小言焕新升级:一键生成吉卜力风,语音大模型与图片问答亮点多多
2025-04-01 07:09:07 AI 22观看
摘要在百度AI DAY的盛会上,文小言迎来了品牌的全面焕新与功能的重磅升级。此次升级,文小言不仅引入了百度自研的文心大模型X1和4.5,还整合了满血版DeepSeek-R1、可灵等第三方模型,实现了多模型的融合调度。更文小言此番还推出

在百度AI DAY的盛会上,文小言迎来了品牌的全面焕新与功能的重磅升级。此次升级,文小言不仅引入了百度自研的文心大模型X1和4.5,还整合了满血版DeepSeek-R1、可灵等第三方模型,实现了多模型的融合调度。rOB28资讯网——每日最新资讯28at.com

更文小言此番还推出了全新的语音大模型、图片问答、AI生成图片与视频等一系列创新功能,为用户带来了更加丰富多样的使用体验。用户现在可以选择“自动模式”,一键调用最优模型组合,无需再为不同任务频繁切换模型。当然,如果用户有特定需求,依然可以选择使用单一的DeepSeek或文心大模型。rOB28资讯网——每日最新资讯28at.com

百度AI产品创新业务负责人薛苏表示,AI的未来已经超越了单纯的技术参数竞争,而是聚焦于如何通过多模型的协同工作,为用户创造真正的价值。文小言致力于打造一个开放的生态,整合顶尖的模型能力,从而推出更强大、更简洁的AI产品。rOB28资讯网——每日最新资讯28at.com

在实际测试中,文小言展现出了强大的功能。当使用文心大模型X1来设计一款吉卜力风格的帆布包时,它能够准确解析风格特点,并连续调用AI绘图工具,快速生成帆布包的正反面效果图。而文心4.5的多模态分析能力,则能精准识别出照片中的地理位置、背景建筑等城市特点。rOB28资讯网——每日最新资讯28at.com

吉卜力风格帆布包设计效果图rOB28资讯网——每日最新资讯28at.com

布鲁克林大桥照片识别效果rOB28资讯网——每日最新资讯28at.com

文小言还支持在拍摄过程中直接用语音提问,能够自动拍摄并识别语音进行回答。在图片问答的基础上,文小言还能基于原图进行一键二次创作,例如上传一张水杯的照片,就能设计出同款的抱枕和鼠标垫。不过,当原图元素过于复杂时,仍可能出现文字拼写错误或主体不一致的问题。rOB28资讯网——每日最新资讯28at.com

语音提问与自动拍摄回答示例rOB28资讯网——每日最新资讯28at.com

基于原图的一键二次创作示例rOB28资讯网——每日最新资讯28at.com

文小言还整合了百度的拍照搜题功能,用户只需在拍摄界面选择“解题老师”,就能自动调用百度教育长期积累的资源,很多题目还配备了视频版数字人讲解。同时,文小言还支持重庆、广西、河南、广东、山东等特色方言对话,并能切换多种音色,如蜡笔小新、孙悟空、熊大熊二等,既能处理复杂知识问答,也能在角色扮演中随时中断。rOB28资讯网——每日最新资讯28at.com

方言对话与音色切换示例rOB28资讯网——每日最新资讯28at.com

据百度语音首席架构师贾磊透露,文小言此次推出的语音大模型是业界首个基于全新互相关注意力机制的端到端语音语言大模型,其调用成本比行业平均水平降低了50%-90%,推理响应速度极快,将用户等待时长缩短至约1秒。虽然目前暂不支持图生图功能,但文小言已经融合了文生图、AI修图、AI视频生成以及“图个冷知识”等科普解读向的新功能。rOB28资讯网——每日最新资讯28at.com

在谈及文小言的商业模式时,薛苏表示,过早进行商业化探索或在用户基础不稳定的情况下进行商业化尝试,可能会对产品造成损失。因此,目前文小言将全面拥抱免费策略,并专注于提升用户体验,这是他们的首要任务。rOB28资讯网——每日最新资讯28at.com

举报 0收藏 0打赏 0评论 0
 
 
更多>同类资讯
点击查看更多 +
全站最新
问界M9/M8:以安全为核,引领豪华智能新风尚!
问界M9/M8:以安全为核,引领豪华智能新风尚!
第四范式2024年营收破50亿,先知AI平台收入大增,净亏损大幅收窄
第四范式2024年营收破50亿,先知AI平台收入大增,净亏损大幅收窄
华兴资本2024年业绩下滑:营收降两成,经调整净亏损3亿,员工缩减16%
华兴资本2024年业绩下滑:营收降两成,经调整净亏损3亿,员工缩减16%
创新奇智2024年度业绩:营收稳健,经营现金流大幅提升80.1%
创新奇智2024年度业绩:营收稳健,经营现金流大幅提升80.1%
小米425亿港元配售引市场波动,股价回调超15% 投资者态度不一
小米425亿港元配售引市场波动,股价回调超15% 投资者态度不一
比亚迪深圳号:全球最大汽车滚装船正式开启试航之旅!
比亚迪深圳号:全球最大汽车滚装船正式开启试航之旅!
热门内容
  • 某大厂大模型高管涉婚变,公司账号停用引热议
  • 美团等巨头联手投资硅基流动,共筑生成式AI设施新蓝图
  • 00后主播借AI工具DeepSeek,直播单日狂揽3.3亿销售额!
  • 华为Pura X震撼发布:独特“阔折叠”形态,售价7499元起引领新潮流!
  • 立陶宛高校:学生不当使用AI,学术不端遭开除
  • 中国AI新突破!全球首款通用Agent产品Manus内测引热议
  • AI大模型时代,文科生将何去何从?
  • 夸克全新升级:AI超级框,你的全能助手来了!
  • Dify携手DeepSeek,基石智算助您轻松部署生成式AI应用
  • 阿里新夸克AI超级框上线,能否撼动腾讯元宝的AI入口地位?
  • 英伟达推出DGX Spark与Station个人AI超算,Spark版售3000美元起
  • 百度文心大模型4.5及X1正式发布,全面免费开放,性能对标国际前沿
  • 360携手华为,昇腾云赋能纳米AI,DeepSeek-R1模型算力再升级!
  • Ollama部署DeepSeek隐患多?腾云悦智安全实验室教你如何加固防护!
  • 315曝光信息黑洞后,辽宁云企智能科技经营异常被列入名录
本栏最新
文小言焕新升级:一键生成吉卜力风,语音大模型与图片问答亮点多多
文小言焕新升级:一键生成吉卜力风,语音大模型与图片问答亮点多多
第四范式2024年营收破50亿,先知AI平台收入大增,净亏损大幅收窄
第四范式2024年营收破50亿,先知AI平台收入大增,净亏损大幅收窄
创新奇智2024年度业绩:营收稳健,经营现金流大幅提升80.1%
创新奇智2024年度业绩:营收稳健,经营现金流大幅提升80.1%
可灵AI能否助力快手突破增长瓶颈,重拾“快”节奏?
可灵AI能否助力快手突破增长瓶颈,重拾“快”节奏?
睿思芯科灵羽处理器:国产RISC-V高性能芯片启航千亿智算市场
睿思芯科灵羽处理器:国产RISC-V高性能芯片启航千亿智算市场
北京朝阳,全国首个工业AI产业园正式亮相!
北京朝阳,全国首个工业AI产业园正式亮相!

本文链接:http://www.28at.com/showinfo-45-11827-0.html文小言焕新升级:一键生成吉卜力风,语音大模型与图片问答亮点多多

声明:本网页内容旨在传播知识,不代表本站观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

显示全文

上一篇:AI大模型新突破!智谱AutoGLM沉思发布,性能媲美DeepSeek-R1

下一篇:第四范式2024年营收破50亿,先知AI平台收入大增,净亏损大幅收窄

最新热点