DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

2025年伊始,DeepSeek在国内外大模型领域掀起了一场波澜壮阔的变革。凭借其卓越的深度推理模型DeepSeek-R1,DeepSeek不仅在国际大模型排行榜上崭露头角,更给国内大模型行业注入了前所未有的活力与紧迫感。DeepSeek的成功,主要体现在两大突破上:一是技术领先,成功跻身国际大模型头部阵营,为国内同行提供了弯道超车的契机;二是算力优化,通过算法创新,以较低算力实现了高质量模型的训练,打破了算力瓶颈的束缚。这一突破让国内大模型企业看到了新的希望,纷纷探索兼顾能耗与精度的解决方案。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

在算力不再是核心难题的背景下,如何平衡大模型的性能与资源消耗成为行业焦点。中科闻歌,这家由中国科学院自动化所孵化的AI企业,近期发布了雅意大模型旗舰版——YAYI-Ultra,为破解大模型落地难题提供了创新方案。作为全球权威的模型评测体系,OpenCompass榜单一直是观察大模型技术发展趋势的重要窗口。在其最新发布的OpenCompass大模型公开学术榜单中,YAYI-Ultra以64.5分的综合得分首次跻身前十,成为TOP10中的中国大模型之一。具体表现如下:代码生成能力在LiveCodeBench评测中排名第五,优于GPT-4o-20241120版本;复杂指令理解能力在IFEval评测中位列第九;知识推理能力在MMLU-Pro评测中同样排名第九。在中文理解能力突出的C-Eval评测中,YAYI-Ultra在允许自主验证的公开访问榜单位列第二,彰显了其在中文场景下的技术优势。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

### 一手实测:YAYI-Ultra的卓越表现

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

官方数据显示,YAYI-Ultra在图表理解、复杂任务规划、长文理解与生成等方面表现突出。我们通过六个维度进行了实测,全面评估其在多模态图表深度理解、复杂图像理解、复杂任务智能规划、数据统计分析及超长文本理解与生成方面的能力。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

#### 01 视觉理解再升级:懂语言,更懂图表

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

首先,我们测试了YAYI-Ultra的图表理解能力。输入提示:“2000年前后,哪个价格区间的物业费占比变化最多?”YAYI-Ultra准确识别柱状图中的不同颜色和数字,充分理解图表并给出精准回答。在多语言场景中,YAYI-Ultra同样表现出色。输入提示:“How did the distribution of agriculture-related employment change between 2012 and 2022? Did it increase or decrease, and by what percentage or amount? Answer in Chinese。”YAYI-Ultra能够准确理解并遵循用户指令,提供跨语言的精准回复。在视觉理解方面,YAYI-Ultra针对跨语言多模态对齐、多图推理、可变分辨率等技术难点进行全面升级,增强了模型在跨语言图表理解、多图表问答、多模态指令遵循等方面的能力,轻松应对堆积条形图、散点图、混合图表等复杂图表场景,并在图表重绘、图表转换等任务上表现突出。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

#### 02 表格智解:万千表格不在话下

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

在工作中,处理复杂报告统计往往费时费力。我们向YAYI-Ultra提供了一张包含行业普通报告、行业深度报告、公司普通报告三种类型交替出现的表格,YAYI-Ultra准确统计出不同类型报告的数量。输入提示:“每种报告类型的数量是多少?”即使面对不规则表格,YAYI-Ultra依然能够精准解析并提取关键数据。以下表格包含总分结构及复杂数据表述,YAYI-Ultra能够准确理解表格中的模型类型、方法及局部性指标变化数值,并完成对比分析。输入提示:“哪个基座模型使用IKE方法后局部性下降最多?”在统计数据理解方面,YAYI-Ultra重点增强了表格问答中复杂排版理解、跨语言问答等能力。从金融报告、学术论文到包含嵌套结构的复杂表格,YAYI-Ultra都能精准定位信息、理解用户意图;同时,模型也能够在跨语言表格问答场景中,提供高效、清晰的解答。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

#### 03 Function Call:复杂任务智能规划

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

我们进一步测试了YAYI-Ultra的复杂任务智能规划能力。输入提示:“绘制去年奥运会中国队金、银、铜奖牌数量折线图(随时间变化)。”YAYI-Ultra准确理解了用户意图,确定“去年奥运会”指的是巴黎奥运会,并制定出详细的任务规划;接下来,模型通过搜索引擎获取巴黎奥运会中国队金、银、铜牌相关数据(包括91枚奖牌的类型及获得时间);再将这些奖牌数据进行梳理,归类分组、按时排序,并生成代码,通过调用代码解释器,完成折线图绘制。YAYI-Ultra之所以能够完成这一系列的复杂任务拆解与规划,离不开其增加的工具调用能力,主要包含搜索引擎、代码解释器、图像解析、天气等基础工具;新闻热榜追踪、传播影响力分析等特色垂直领域工具。模型显著增强了在多工具串行调用场景下的规划合理性,同时提升了复杂搜索场景下的信息收集能力。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

#### 04 多模态输出:图文并茂,直观简洁

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

在文献阅读或信息收集过程中,我们通常需要从多篇文档中查找、分析特定信息。YAYI-Ultra不仅能够通过文字分析描述,还能同步给出对应的图片内容。输入提示:“The percentage of different behaviors under different collaborative strategies。”YAYI-Ultra根据问题,从用户构建的“人工智能论文知识库”中识别相关的多篇人工智能论文,并据此进行回答。答案中不仅有文字,还在对应的引用位置给出了原始图片,大大提升了阅读体验及答案可靠性。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

#### 05 全栈长文:吞吐万言,下笔如神

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

YAYI-Ultra最令人惊艳的能力之一是超长文输出,支持最长20万字输入和10万字超长输出,形成从“输入理解”到“内容创作”的全链路长文本能力闭环。YAYI-Ultra支持联网智能创作与文献锚定创作双模式,并将长文写作任务拆解为更小、更可控的子任务(先生成大纲,再根据大纲生成全文),有效保证了文本结构,提升长文生成质量。联网智能创作模式下,输入提示:“写一篇30000字的中国儒家文化发展历史分析报告。”文献锚定创作模式下,输入提示:“请根据参考资料写一篇长文,写作的主题是‘通用人工智能解决方案:创新与效率的完美结合’。”YAYI-Ultra都能精准完成长文创作任务。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

#### 06 数据分析:精准求解,可视交互

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

最后,我们测试了YAYI-Ultra的数据分析和可视化图表绘制能力。输入提示:“根据表格,计算人均月收入,然后计算月收入与人均月收入的差值,绘制一个柱形图,横轴是名字,纵轴是差值,标题是‘每人收入与平均值差距’。”YAYI-Ultra根据用户要求,通过Python of Thought(POT)能力,生成Python代码并执行,精准完成了统计推断、矩阵运算、数值优化等数值密集型任务。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

### 从“大水漫灌”到“精准匹配”:YAYI-Ultra的灵活专家配置

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

当前,AI大模型落地正面临“能力-成本”剪刀差扩大的关键节点。IDC最新报告显示,企业在AI大模型落地过程中,面临模型精度不能完全满足业务需求的问题;同时,92%的企业认为在大模型工程化落地阶段,缺少算力资源是最大的挑战。中科闻歌雅意技术团队透露,YAYI-Ultra是以多领域能力为特色的混合专家模型,为了提升在不同领域专业任务上的表现,采用灵活的专家配置模式,支持数学、代码、金融、舆情、中医、安全等多种领域专家组合,能显著缓解稠密模型在垂直领域迁移过程中普遍存在的“跷跷板”现象,可针对不同领域需求,为行业提供“高精度、低能耗”的智能化解决方案。

DeepSeek引领低成本革命 国产大模型如何兼顾高精度低能耗

在媒体领域,中科闻歌推出红旗3.0融媒体智能平台,基于YAYI能力,帮助客户将内容创作时间缩短30%-50%,内容发布频率提升了20%-40%。某客户在引入自动化审核能力后,内容差错率从5%降至0.5%左右,目前已广泛应用于新华社、央视、中国日报等头部媒体。在医疗领域,基于YAYI的大医金匮中医大模型,可精准诊断500余种常见病症,为患者提供个性化的治疗方案,经临床专家测评辨证推理准确率高达90%,在中医师资格考试模拟测试中表现优异,准确率超过94%。并面向C端用户推出了“大医金匮”中医健康管理APP。在财税领域,基于YAYI的财税知识大模型,经专项测评,模型回答准确率90.1%,高于其他同类型模型,在接入大模型后,客户实现24小时不间断的咨询服务,使得用户减少排队时间约50%,用户满意度提升超过30%。航天信息与中科闻歌联合研发的财税知识大模型已在多个行业应用落地。

当前,YAYI-Ultra(yayi.wenge.com)已在官网开放数据分析、知识库文献解析、超长文写作功能体验,感兴趣的用户可以登录试用。

文章网址:https://www.wpbull.com/ai/19455.html