实测4款头部PPT生成大模型：配图错误频发、数据可视化集体翻车

时间： 2024-08-28 03:37 浏览量：507

文｜科技新知余寐
编丨赛柯

继聊天机器人、文本创作、图像生成、视频生成之后，大模型高调“卷”入PPT生成中。

入局者既包括传统办公软件开发商，如金山办公推出WPS AI、iSlide推出iSlide AI；也包括互联网巨头百度、阿里等携百度文库、夸克AI PPT出场；还有科大讯飞、天工AI、月之暗面Kimi等AI领域的重量级选手。各家纷纷拿出看家本领，争相在PPT赛道上赢得先机。

比如，国产大模型Kimi联合AiPPT推出PPT助手，而科大讯飞也不甘示弱，发布了讯飞智文2.0版本的智能文档AI助理，一键生成PPT升级版。这些工具不仅能提炼文档核心生成大纲，还能一键切换主题模板，甚至支持多文档到PPT的转换……每一个功能都写着“省时省力”，每一个营销点都体现着“卷”的决心。

毕竟“天下苦PPT久矣”，PPT制作一直是职场人士的一大痛点，技术的较量若能推动办公生产力的革新，用户自然喜闻乐见。但是，面对如此硬核的用户真需求，如若企业只是打着AI的幌子交一份伪答卷，无疑将达到反效果，伤了用户的心。

因此，「科技新知」本次将在国产大模型中挑选四名选手进行实测，包括Kimi、讯飞智文、百度文库、WPS，以观察大模型企业对打工人的诚意几何。

为确保测评结果的客观性和参考价值，我们采用以下设定：

1.使用统一的中文提示词，包括简易提示词和复合提示词；

2.每个大模型的测试项目都包括：输入主题生成PPT、上传文档生成PPT；

3.统一使用电脑网页版及其默认设置；

4.统一呈现一次生成结果，不进行二次调整优化。

以下是各个模型表现情况：

生成方式1: 输入主题生成PPT

指令：你是一名经验丰富的影视产业观察者，被邀请至高校的课堂做分享，主题是2024年国内五一档电影及其票房分析，现在需要你据此做一份PPT，要求要有清晰的结构和逻辑，精准的数据支持，精美的视觉设计，须包含图表，总页数不超过20页。

指令说明：作为一个信息沟通工具，PPT应有效地在繁杂的信息中提炼要点、归纳总结，并将多数据部分做可视化呈现。因此，为测试这几款AI PPT的基本能力，本轮测试专门选用具备多主体、多数据主题。

WPS AI

WPS AI：近900字的PPT大纲，层级分明、内容全面，不禁让人对这个汇报充满期待，但最终生成的PPT却只是把大纲填充进用户所挑选的模板中，具体内容仍需用户自行检索、归纳、分析。

如“背景介绍”部分，WPS AI非常直白地留下一句“分析2024年国内五一档电影市场，了解电影产业发展趋势”，相当于只给用户提供一个思考思路，但相信不少读者跟「科技新知」一样，希望AI能完成到分析这一步；对于“影视产业现状概览的市场规模”也仅有一句“高度概括”的表述：国内影视产业持续增长，市场规模不断扩大——水得太明显了。

Kimi

Kimi：1分钟的时间里，Kimi生成了近2000字的大纲，试图用20页PPT完成背景介绍、情况简介、票房数据分析、受众分析、成败因素分析、营销策略分析、政策环境与市场监管、未来市场展望……只能说全面，十分全面。但问题也在于此——主题不突出，未能聚焦“2024年国内五一档电影及其票房分析”。

和WPS AI一样，在“一键生成PPT”上，Kimi给到的也是一个思路框架、分析模板，如在“2024年票房数据分析”中，Kimi给出的回答是“详细列出2024年五一档期间各部影片的票房数据，包括总票房、单日票房、观影人次等关键指标。分析票房数据背后的市场因素，如影片质量、宣传力度、观众口碑等。”不得不承认，这是一个相当完整的分析思路，相较于WPS AI也更为详细。

百度文库

百度文库：如图所示，百度文库所生成的PPT目录页即其大纲的全部，看起来是位惜字如金的选手。意料之外的是，低期待等来了小惊喜，在前三个产品的测试中，百度文库几乎是最符合「科技新知」对“一键生成PPT”所设想的，包括结构完整、详略得当、主题突出、能引用官方数据并做分析。

但在生成大纲环节上，百度文库出现两段100%重复的内容，由此生成出来的PPT也同样发生重复。但基于其在内容上的优异表现，这点不足倒也影响不大，只增加了后期手动删除的步骤。

讯飞智文

讯飞智文：出现多处排版叠字现象，但瑕不掩瑜，有别于WPS AI和Kimi的笼统和全面，讯飞智文对主题的把握更为准确，能够合理分配各部分内容的比例，并能围绕主题对相关维度做有效分析，如不同影片类型分布及特点、购票渠道与观影模式、重点城市票房数据等；信息抓取和文本生成能力较为突出，符合主题且有足够的丰富度。

生成方式2: 上传文档生成PPT

指令：你是一名大学生，要做一个课程期末汇报，文档名称为“电影《傲慢与偏见》人物形象分析汇报”，字数1500，包含电影简介与创作者简介、故事梗概、主要角色人物形象分析、人物刻画手法及小结，请你根据这份汇报讲稿生成一份PPT。

指令说明：这项测试是为根据文档生成一份汇报演讲稿。按一般人平均语速约240字/分钟计算，整个汇报约6分半。主要评估AI的语言和场景理解能力、文本阅读能力、概括提炼能力等。

WPS AI

WPS AI：整体而言，是名简约派选手，包含封面及尾图，成品仅6页。排版合理，但配图毫无关联；对文档内容的处理中规中矩，只做了基于文档本身的处理，没有做文档外的内容补充。

Kimi

Kimi：尽管上传的文档已经是完成的一篇汇报演讲稿，但Kimi似乎有自己另外的想法，它基于演讲稿的框架和模板做排篇布局，提炼要点，但没有展开分析，而是提供给用户思考的方向，更像是一份“半成品”。用户需再根据其指示自行填充内容。此外，Kimi在本轮表现中竟存在内容与小标题颠倒（混淆？倒置？还是说正文与小标题识别错误，位置颠倒之类的会清晰一点？）的低级错误。

百度文库

百度文库：根据其提供的选项，我们在“原文一致”和“适当扩写”中选择了后者，成稿确实有基于文档内容补充有效信息和完善，并且扩充内容能够围绕“人物形象”这个关键词展开，逻辑合理。排版无太大问题，较为致命的是配图出现错误，用成《小妇人》的电影截图。

讯飞智文

讯飞智文：排版依旧没有将模板和文字内容进行合理编排，出现多处叠字现象，且PPT页面字数过多，不仅影响观感，也不利于观众对信息的快速获取。但通过联网扩写，成品能基于演讲稿对汇报内容进行有效地完善。此外，其提供的AI配图是个亮点，虽然图文相关性还有待加强，但已比前几家的图片表现要好。

生成方式3:其余相关维度测评

除整体成稿呈现外，我们还从以下几个相关维度进行测评：响应速度与效率、使用成本和价格、模板与样式、用户体验与交互、安全与隐私保护。

四款AI大模型PPT生成时间

“一键生成”无疑是被PPT硬控的打工人和学生党梦寐以求的功能。毕竟，一份精美的PPT从挑选模板开始，就要耗费大量的时间和精力。再到梳理结构、确定文本、斟酌用词、排版布局、设计优化等，可称为繁琐的集合。总体来看，本期测试的四款产品无论是通过输入主题生成还是上传文档生成，成品时间都控制在2.5分钟内。其背后考验的是高效的数据管理机制及算法系统等。

看起来，速度与质量有时难兼得。在输入主题生成中，讯飞智文以整体时间1分钟的优异成绩胜出，且内容质量高。在上传文档时，WPS AI仅用了29s，但内容在四家中垫底。

四款AI PPT测评对象对比表

在使用成本方面，AI新秀Kimi出手相当阔绰，目前，其PPT助手功能均可免费使用。其余三家均采用付费会员权益。但在当前拉新阶段，三家也都设有免费或低价限时体验包。

挑模板往往是PPT人艰难的第一步。整体来看，四款产品的PPT模板库均以教育、职场办公、科技、商务场景为主，适用场景及主题还有待进一步丰富。Kimi的大手笔贯穿全程，免费模板量居榜一，而百度文库多数模板均为VIP权益，即使是免费模板，生成后下载到本地电脑也需付费。

从样式上来看，各家生成的PPT在字体、动画效果和幻灯片切换上都以“基础款”打底，支持在线编辑或下载后编辑。

WPS AI界面

Kimi界面

百度文档界面

讯飞智文界面

从交互体验来看，四款产品注册登录方式便捷，均可通过手机验证码注册登录；支持网页操作；从界面上看，WPS AI、Kimi和讯飞智能走的是极简风，用户能快速找到所需功能，百度文库页面则较为复杂，“AI生成PPT”则位于页面最右的智能助手，操作界面只有整个首页的五分之一。

在安全与隐私保护方面，四家均无明显的隐私政策，未就如何收集、使用和保护用户数据在显眼处做相关说明。

测评观察：技术进步与用户期待的较量

不得不承认，在对四款AI PPT产品的测评中，我们见证了人工智能在内容创作领域的重要进步。仅需简单输入指令、点击生成，一双无形的手便以惊人的速度开始编排并“立即生成”，这对于被PPT绑架的用户无疑是一种解脱。

速度固然重要，但质量才是核心。对话、文本生成是大部分企业切入赛道的第一个发力点，在日复一日的数据训练中，大模型的自然语言处理能力得到显著提升，这也为其往多模态发展打下了坚实的基础。基于此，在本次测评中，四款产品在逻辑分析上都有相当不错的表现。

但在文本内容生成上，各家大部分还停留于“提供思路”的层次，在提取有效信息，生成准确且有深度的文本上还有待加强，如WPS AI和Kimi。相比较而言，百度文库和讯飞智文在本次测试中表现出另一梯队的水准。如果说WPS AI和Kimi可以一键生成一份合格率为50%的PPT，那百度文库和讯飞智文基本是80%的水平，这或许也得益于其背后百度、百度文库和科大讯飞在知识引擎和内容数据上的积累。

欣喜有之，遗憾亦有之。在「科技新知」最期待的数据可视化部分，四名选手则无一例外地选择“视而不见”。数据——悬在大厂人头上的“达摩克利斯之剑”，同样是PPT里的灵魂担当，通常包含数据比对，并以图表、图形等形式呈现，使其更直观、易懂。这也是当代打工人做PPT的共识。为此，在“输入主题生成”测试中，我们专门挑选了有数据信息的主题，并下达具体指令，要求成稿“须包含图表”，结果却没有看到相应内容的生成。遗漏用户需求，也反映出对PPT使用痛点和场景理解的不够深刻。

另一个不容忽视的问题是，PPT常见应用场景既包括学校，也有科研机构、政府及企业等，也意味着大量的数据隐私、商业秘密等。而当前AI PPT大模型产品在数据隐私保护上还显得标准不足、底气不足，也都默契地在宣传营销层面避而不谈。

这么看来，PPT离“一键生成”的终极目标还有距离。各路玩家赶路之余，还需继续练好内功。

大模型综合能力的提升，很大程度上依赖于海量数据的喂养，其开发与训练是一项需要全方位资源投入的复杂工程。它不仅依赖顶尖人才团队和前沿技术，也离不开丰富的高质量语料库，这要求开发者具备持续的数据采集和处理能力。同时，还需投资大量硬件资源以提供必要的算力资源。

简而言之，大模型的开发是一场对技术深度、数据广度和算力强度的综合考验，而每一项技术进步的背后都是“烧钱”。

“百模大战”是过去式了，已经到了求生的阶段。解锁新应用场景，是大模型逐步走向商业化的必经之路。据月狐数据测算，2024年6月智能PPT行业用户规模已达到920万，行业近3月用户规模复合增速达21%。面对“PPT”这一需求庞大的内容生成领域，谁又甘心在这场争夺赛中掉队？

抢占刚需的市场，企业务必要拿出实实在在的真本领了。除此之外，针对用户的培育模式也值得考究，它关乎企业能否长远地赢得市场与人心。回顾这几年全球流行的在线办公软件发展历程，从一开始的免费送福利造福上班族，到后来设置使用限制，逐步按功能收费“割韭菜”，引来一片骂声。至今为止，关于这些企业的实际产出回报率及用户留存率的具体数据仍显匮乏，使得外界难以全面评估其经营成效。

面对你我日益被AI重塑的生活，不管拷问得多细致都不为过。毕竟每一个为科技买单的用户，都还要再付诸时间、隐私及信任。承载着打工人与学生党厚望的PPT“帮手”，可别把好牌打得稀巴烂。

关键词 : AI百度文库数据可视化新浪众测

新浪科技公众号

“掌”握科技鲜闻（微信搜索techsina或扫描左侧二维码关注）

欢迎访问江西之窗 今天是 2024年11月01日 星期五

实测4款头部PPT生成大模型：配图错误频发、数据可视化集体翻车

欢迎访问江西之窗今天是 2024年11月01日星期五