查看原文
其他

从“创造”到“综合”:B2B应用中的AI革新

常华Andy Andy730 2024-03-16

【ANDY】1.我经常讲2023年是奇点,另一层意思是当前只是开端,但是是宏大的开端;2. 对于企业级场景,分析/归纳/推理、准确性是致命的要求,否则无法应用于决策。


Source: Zeya Yang, Kristina Shen, For B2B Generative AI Apps, Is Less More? March 30, 2023


在过去的几年里,我们看到大型语言模型(LLM)变得越来越流行,并研究了在B2B应用环境中的实现。尽管有一些巨大的技术进步和LLMs在普遍的时代背景中的流行,但我们认为目前仍然仅处在B2B应用场景下生成式AI应用的第一波。随着公司确定使用场景并寻求在其产品周围建立护城河,我们预计从当前的“第一波”转变为更专注的“第二波”的方法和目标。


迄今为止,生成式AI应用程序主要集中于信息的分散。也就是说,它们根据一组指令创建新的内容。在第二波中,我们相信我们将看到更多的AI应用程序将信息汇聚。也就是说,它们将通过综合可用的信息来展示我们更少的内容。因此,我们将第二波称为合成AI("SynthAI")以与第一波形成对比。虽然第一波在应用程序层面上创造了一些价值,但我们相信第二波将带来一个阶跃式的变化。


最终,正如我们在下面解释的那样,B2B解决方案之间的竞争将不再集中于令人眼花的AI能力,而是更加关注这些能力将如何帮助公司拥有(或重新定义)有价值的企业工作流程。


第一波浪潮:从消费者到企业的过渡


要分析第一波的情况,首先需要区分B2C和B2B应用。当我们作为消费者使用生成式AI时,我们的目标是娱乐和分享。在这个场景中,质量或正确性并不是高度优先考虑的问题:让AI模型生成艺术或音乐并分享到Discord频道是一件有趣的事情,而很快我们就会忘记它。我们也有心理倾向,认为“更多”=“更高生产力”=“更好”,所以我们被自动创作所吸引。ChatGPT的崛起就是一个很好的例子:我们容忍质量上的缺陷,因为有更多东西可以分享是更令人印象深刻的。


当涉及到B2B应用时,目标是不同的。主要是对时间和质量进行成本效益评估。要么是想用相同的时间生成更好的质量,要么是想在相同的质量下更快地生成。这就是从B2C到B2B的初始转化出现问题的地方。


我们在工作场所中使用B2B应用时,质量变得很重要。然而,如今由AI生成的内容大多仅适用于重复性和低风险的工作。例如,生成式AI适用于撰写广告或产品描述的简短文字;我们看到许多B2B应用在这方面展示了令人印象深刻的增长。但是我们随后发现,当涉及到撰写洞察或论点时,生成式AI的可靠性较低(即使AI生成的内容令人信服或自信,也经常是不准确的),而这在B2B环境中的创新和协作方面更具价值。例如,一篇宣布为软件开发人员推出新产品的博客文章需要相当多的人工修饰,以确保它的准确性和消息将与目标受众产生共鸣。


另一个越来越常见的例子是编写外向型销售电子邮件。生成式AI适用于通用的、冷漠的外向型邮件,但如果要求准确的个性化就会变得不太可靠。从一个优秀的销售代表的角度来看,生成式AI可以帮助以更少的时间写更多的电子邮件,但是为了写出提高响应率并最终导致预定会议的电子邮件(这是代表评估的标准),代表仍需要研究并使用他们的判断力来确定那个潜在客户想要听什么。


总的来说,第一波浪潮对于头脑风暴和起草阶段的较实质性的撰写是成功的,但是最终需要的创造力和领域专业知识越多,就需要越多的人工修饰。


打乱工作流程的成本(或收益)是什么?


即使在生成式AI对于较长的博客文章有用的情况下,提示也必须是精确和规范的。也就是说,在AI可以用长篇形式表达它们之前,作者必须已经对代表博客文章实质的概念有清晰的理解。然后,在得到可接受的最终结果之前,作者必须审核输出、迭代提示,并可能重新撰写整个部分。


一个极端的例子是使用ChatGPT生成法律文件。虽然这是可能的,但提示需要熟悉法律的人提供所有所需的条款,然后ChatGPT可以使用这些条款来生成较长的文件的草案。考虑从条款表到完成文件的类比。AI无法执行主要当事方之间的谈判过程,但一旦所有关键条款确定,生成式AI可以撰写较长的完成文档的初步草案。然而,经过培训的律师需要审核和编辑输出,将文档编辑到当事方可以签署的最终状态。


这就是为什么在B2B场景中成本效益评估会出现问题。作为知识工作者,我们正在评估是否值得为我们的工作流程添加额外的基于AI的步骤,还是我们应该自己完成。今天,随着第一波应用程序的出现,答案通常是我们最好自己完成。


第二波浪潮:整合信息以改进决策


随着我们进入下一波生成式AI应用,我们预计会看到重心从信息生成转向信息综合的转变。在知识工作中,决策具有巨大的价值。员工的工作是基于不完美的信息做出决策,而不是产生大量内容来执行或解释这些决策。在许多情况下,更长不是更好,只是长度而已。


许多格言都支持这一点:代码行数并不是工程生产力的好衡量标准;产品规格书越长并不一定提供更多关于需要构建什么的澄清;更长的幻灯片也并不总是提供更多的洞见。


Hex公司的CEO兼联合创始人Barry McCardel相信人机共生,并强调LLM如何改善我们的工作方式:


“人工智能是来增强和改善人类,而不是取代他们的。在理解世界和做出决策时,你需要将人置于循环中。人工智能所能做的是帮助我们将更多的脑电波应用于有价值的创造性工作中,这样我们不仅可以花更多的时间在重要的工作上,而且还可以释放我们的潜能,做出更好的工作。”


人工智能如何改善人类的决策?我们相信LLM需要专注于合成和分析——SynthAI——以提高决策的质量和/或速度(请回想我们上面的B2B图表),如果不是自己做出实际决策的话。这里最明显的应用是总结大量的信息,这是人类无法直接消化的。


未来,SynthAI的真正价值将在于帮助人类更快地做出更好的决策。我们正在设想几乎与ChatGPT用户界面相反的情况:如果我们能够从大量数据中反向工程出总结它的简洁提示,那会怎样?我们认为有机会重新思考UX,将大量信息尽可能高效地传达出来。例如,像Mem(https://get.mem.ai/)这样的AI驱动的知识库保存了组织中每次会议的记录,可以主动建议有关的决策、项目或人员,供某人在开始新项目时参考,节省他们数小时(甚至数天)的机构先前知识的查找时间。


回到我们的销售电子邮件示例,其中一个潜在的表现是,人工智能可以识别目标客户在最高意愿水平时(基于新闻报道、财报电话会议、人才流动等),并提醒相关销售代表。基于综合研究,AI模型会提出一两个最重要的问题,以及与该目标客户最相关的产品特点。具有讽刺意味的是,这些输入可能会被输入到第一波的解决方案中,但价值来自合成阶段,并为销售代表节省了数小时的研究时间。


确保这种合成足够高质量的根本性转变将是从大规模、通用模型转向利用多个模型的架构,包括在特定于领域和用例的数据集上训练的更精细的模型。例如,构建客户支持应用程序的公司可能主要使用一个支持为中心的模型,该模型可以访问公司的历史支持工单,但在极端情况下会回退到GPT。在某种程度上,微调的模型和数据集是专有的,这些组件有机会成为交付速度和质量的护城河。


实施 SynthAI


在我们思考第二波可能是什么样子时,我们认为最能从合成AI中受益的用例是同时满足以下两个条件的情况:

  • 信息量很大,以至于人工逐个筛选所有信息不切实际。

  • 信噪比高,使主题或见解明显且一致。为了准确性,你不希望让AI模型去解读微妙之处。


在下图中,我们通过这些维度对常见的分析和合成示例进行分类,以帮助理解。


这有助于我们思考第二波应用将提供哪些类型的结果,以及它们与第一波结果的区别。下面,我们试图提供一些例子来说明这些比较,但它们绝不意味着是全面的。


工作流所有权之争


现有的记录系统和工作流解决方案以及全新的AI原生解决方案之间自然而然地展开了一场竞赛,试图嵌入AI增强能力。我们想明确他们正在朝着什么方向发展:不是谁能建立AI综合能力,而是谁能拥有工作流程。对于现有解决方案,供应商正在竞相通过改进他们的工作流程来嵌入AI以巩固他们的现有工作流。对于挑战者,供应商将使用最佳AI实施作为一个楔子,试图从这里扩展以重新定义工作流。


对于产品反馈用例,Sprig一直使用AI来分析开放文本和语音回复,并将它们汇总成主题。Sprig的创始人兼CEO Ryan Glasgow对LLMs提高他们的综合解决方案的潜力感到兴奋:


“通过LLMs,我们可以比以前更省去我们的客户的时间。在我们之前的模型中,我们需要人为干预审查过程,然后客户才能看到主题;现在,我们可以直接展示主题,并在之后进行审查。此外,我们现在能够为每个主题添加描述符,提供更具体的细节,使得这些洞见更具可操作性。


“未来,我们认为有机会让用户提出后续问题,如果他们想进一步挖掘一个主题。归根结底,这是关于提供端到端的工作流程——从快速收集数据到快速理解数据——以帮助实时做出决策。”


同时,我们已经看到一些新的初创企业专注于使用AI来汇总用户反馈,并与正在收集原始反馈的现有平台集成。


在对外销售的应用案例中,ZoomInfo最近宣布将GPT整合到他们的平台中,并分享了一个演示视频。视频的某些部分与我们描述的第二波示例非常接近。同样地,我们已经看到新的初创企业专注于采用以“AI为先”的方法尽可能地自动化整个对外销售过程。


AI可能改变我们工作方式的潜力是无限的,但我们仍处于早期阶段。在B2B应用中,生成式AI需要进化,超越创建更多内容,发展出能够让我们更好、更快地完成工作的综合AI。在B2B应用中,这是一个不断围绕着谁能主导工作流的舞蹈,而AI原生应用程序将使这种舞蹈变得更加有趣。

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存