这么多大模型，我还是最期待腾讯的

Original 池建强 MacTalk 2024-02-02

今天，腾讯正式亮相了自家的通用大模型“混元”。

至此，国内几家有云业务的科技公司，都已经初步完成了大模型领域的布局。虽然现在市场上有几百个大模型产品，但我还是更期待腾讯的。一方面，腾讯有云和场景的优势；另外一方面，腾讯这公司和苹果风格很像，做事务实，不喜欢炒作概念。务实很重要，毕竟，大模型已经进入了应用阶段。

有人可能会说，怎么腾讯才发布啊，是不是晚了。

不晚，一切刚刚好。只要今年发布，都谈不上晚。AI 大模型早就过了喧嚣炒作的阶段，现在，大家需要的是一个实用、接地气的产品。早几天，晚几天问世，改变不了什么。就像我早先使用过的几款 AI 产品，倒是有先发优势，但那像半成品一样的体验，早已让人失去信心。

况且，腾讯也不是仓促应对，早在 2018 年，人家就已经开始探索大模型相关技术了。最近，像腾讯广告、腾讯游戏、腾讯会议、腾讯文档等多个内部业务和产品，也都接入了腾讯混元大模型。所以，准确来说，今天不是发布，而是对外亮相。

二月份，ChatGPT 大火，很多人预言这意味着第四次工业革命的开端。我说我还是持审慎的态度吧。初次碰见一个令人兴奋的事物，人类总是容易过度恐惧或过度赞美，其实，那都是不熟悉带来的幻影。

记得那会，很多人都说，赶紧进场啊，这才是新机会，再晚黄花菜都凉了。制造错失恐惧症真是门好生意。我不是固执，也不是不理解机会，只是不想被一时的情绪煽动，然后在冲动和恐惧之下做出孤注一掷的荒诞决策。

现在，那股子新鲜劲儿过去了。

之前，大家乐衷于让大模型写首诗、写篇小作文、问几个抖机灵的问题，但其实在真实的场景中，几乎不会这样使用。从落地角度看，人们更关心的是大模型的安全性、可靠性、调用成本、生成速度等更为实际的问题。

最近我们在做一个智能问答机器人的项目，群里几千号人，大家也都是为这些柴米油盐类的事情发愁。毫无疑问，越来越多的企业已经开始思考怎么在业务之中集成大模型的能力。这时候，那些花哨的玩具和概念根本无法满足大家需求。提供给用户的东西，得可靠，得可控，得便宜。

接下来，就看哪个大模型能把类似问题解决好。

早上听直播，嘉宾说当下国内已经有一百三十多个大模型了。好吧，我少见多怪了。同质化的功能之下，随着市场的发展，自然而然会迎来优胜劣汰。就像十年前的百团大战那样。什么样的产品能胜出？这也是最近我在琢磨的问题。

我觉得，大模型最后还是有云服务能力的大公司的天下。建造大模型需要钱，需要算力，需要数据，需要人才。而大公司，特别是那些有云服务能力的大公司，在这之前，或多或少都有这方面的深厚积累。

并且，大模型最好的落地载体，也是通过云。基于云，可以调用模型 API，出售算力，也可以完成私有大模型的部署，还能进行数据清洗、存储、挖掘等。所以，肉眼可见的逻辑是：大模型，包括开源大模型，最后还是云计算的生意。

再聊回到腾讯混元大模型，我已经体验了一上午，确实还不错。官方在发布会中，也重点提到了他们着力打磨的特性：

第一，可靠。大模型这技术，成也幻觉，败也幻觉。在一些对准确性要求较高的场景中，胡说八道会让人心里没底。混元在预训练阶段，通过算法进行事实修正，有效降低了大模型的幻觉比例。这是一大亮点。

第二，安全。对于企业应用而言，安全是底线需求，要不然一切都无从谈起。混元通过强化学习的方法，部分解决了安全诱导类的问题。比如，你问它，怎么自杀之类的问题，它不会傻了吧唧给你指导方案。

第三，推理。这块我亲测混元效果最好。比如我问，“今天是 9 月 2 日，星期四，请问下周二是几号？”哈哈哈，我体验过的大部分大模型都无法准确回答这个简单的问题，但混元可以。

第四，成熟。比如对于长文的生成能力，混元做了优化。我体验过的几个模型，包括 Notion AI，在生成长文时，总是容易发生截断，并且字数也达不到我的要求。混元着重提高了长文本的续写和生成能力。

如果你最近也在业务中落地大模型的话，就不难理解，混元这些特性，基本都是扣着企业的痛点问题而去的。就拿我们最近在做的智能问答机器人而言，如果不解决安全、可靠、可控的问题，那我们是没有信心给用户用的。

今明两天，YC 也正在举办今年夏天的 Demo Day。从已经披露的信息来看，这次路演的项目中，有将近 60% 的项目都与 AI 相关。大模型技术正在融入到各个领域之中，于无声处听惊雷。

随着像腾讯混元这样的更可靠、对中文支持更好的商用大模型的发布，其实我们在产品中融入大模型的门槛也已经变得越来越低。你不妨也可以试试，咱尽力赶上这次技术浪潮。

Original 池建强 MacTalk

MacTalk

向上滑动看下一个