查看原文
其他

这么多大模型,我还是最期待腾讯的

池建强 MacTalk 2024-02-02
今天,腾讯正式亮相了自家的通用大模型“混元”。
至此,国内几家有云业务的科技公司,都已经初步完成了大模型领域的布局。虽然现在市场上有几百个大模型产品,但我还是更期待腾讯的。一方面,腾讯有云和场景的优势;另外一方面,腾讯这公司和苹果风格很像,做事务实,不喜欢炒作概念。务实很重要,毕竟,大模型已经进入了应用阶段。
有人可能会说,怎么腾讯才发布啊,是不是晚了。
不晚,一切刚刚好。只要今年发布,都谈不上晚。AI 大模型早就过了喧嚣炒作的阶段,现在,大家需要的是一个实用、接地气的产品。早几天,晚几天问世,改变不了什么。就像我早先使用过的几款 AI 产品,倒是有先发优势,但那像半成品一样的体验,早已让人失去信心。
况且,腾讯也不是仓促应对,早在 2018 年,人家就已经开始探索大模型相关技术了。最近,像腾讯广告、腾讯游戏、腾讯会议、腾讯文档等多个内部业务和产品,也都接入了腾讯混元大模型。所以,准确来说,今天不是发布,而是对外亮相。
二月份,ChatGPT 大火,很多人预言这意味着第四次工业革命的开端。我说我还是持审慎的态度吧。初次碰见一个令人兴奋的事物,人类总是容易过度恐惧或过度赞美,其实,那都是不熟悉带来的幻影。
记得那会,很多人都说,赶紧进场啊,这才是新机会,再晚黄花菜都凉了。制造错失恐惧症真是门好生意。我不是固执,也不是不理解机会,只是不想被一时的情绪煽动,然后在冲动和恐惧之下做出孤注一掷的荒诞决策。
现在,那股子新鲜劲儿过去了。
之前,大家乐衷于让大模型写首诗、写篇小作文、问几个抖机灵的问题,但其实在真实的场景中,几乎不会这样使用。从落地角度看,人们更关心的是大模型的安全性、可靠性、调用成本、生成速度等更为实际的问题。
最近我们在做一个智能问答机器人的项目,群里几千号人,大家也都是为这些柴米油盐类的事情发愁。毫无疑问,越来越多的企业已经开始思考怎么在业务之中集成大模型的能力。这时候,那些花哨的玩具和概念根本无法满足大家需求。提供给用户的东西,得可靠,得可控,得便宜。
接下来,就看哪个大模型能把类似问题解决好。
早上听直播,嘉宾说当下国内已经有一百三十多个大模型了。好吧,我少见多怪了。同质化的功能之下,随着市场的发展,自然而然会迎来优胜劣汰。就像十年前的百团大战那样。什么样的产品能胜出?这也是最近我在琢磨的问题。
我觉得,大模型最后还是有云服务能力的大公司的天下。建造大模型需要钱,需要算力,需要数据,需要人才。而大公司,特别是那些有云服务能力的大公司,在这之前,或多或少都有这方面的深厚积累。
并且,大模型最好的落地载体,也是通过云。基于云,可以调用模型 API,出售算力,也可以完成私有大模型的部署,还能进行数据清洗、存储、挖掘等。所以,肉眼可见的逻辑是:大模型,包括开源大模型,最后还是云计算的生意。
再聊回到腾讯混元大模型,我已经体验了一上午,确实还不错。官方在发布会中,也重点提到了他们着力打磨的特性:
第一,可靠。大模型这技术,成也幻觉,败也幻觉。在一些对准确性要求较高的场景中,胡说八道会让人心里没底。混元在预训练阶段,通过算法进行事实修正,有效降低了大模型的幻觉比例。这是一大亮点。
第二,安全。对于企业应用而言,安全是底线需求,要不然一切都无从谈起。混元通过强化学习的方法,部分解决了安全诱导类的问题。比如,你问它,怎么自杀之类的问题,它不会傻了吧唧给你指导方案。
第三,推理。这块我亲测混元效果最好。比如我问,“今天是 9 月 2 日,星期四,请问下周二是几号?”哈哈哈,我体验过的大部分大模型都无法准确回答这个简单的问题,但混元可以。
第四,成熟。比如对于长文的生成能力,混元做了优化。我体验过的几个模型,包括 Notion AI,在生成长文时,总是容易发生截断,并且字数也达不到我的要求。混元着重提高了长文本的续写和生成能力。
如果你最近也在业务中落地大模型的话,就不难理解,混元这些特性,基本都是扣着企业的痛点问题而去的。就拿我们最近在做的智能问答机器人而言,如果不解决安全、可靠、可控的问题,那我们是没有信心给用户用的。
今明两天,YC 也正在举办今年夏天的 Demo Day。从已经披露的信息来看,这次路演的项目中,有将近 60% 的项目都与 AI 相关。大模型技术正在融入到各个领域之中,于无声处听惊雷。
随着像腾讯混元这样的更可靠、对中文支持更好的商用大模型的发布,其实我们在产品中融入大模型的门槛也已经变得越来越低。你不妨也可以试试,咱尽力赶上这次技术浪潮。
推荐阅读:
Discord 的产品故事
继续滑动看下一个

这么多大模型,我还是最期待腾讯的

池建强 MacTalk
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存