查看原文
其他

本周硅谷发生了什么?|OpenAI推出5项更新;微软组建新的AI团队;Googe发布文生视频模型Lumiere

王怡宁 智能涌现 2024-04-01


文|王怡宁

编辑|邓咏仪 尚恩

封面来源|IC photo

一周纵览

本周硅谷大厂最值得关注的,是各家的大模型均有不少上新。OpenAI宣布了多项模型更新,同时发布了GPT-4 Turbo预览模型,提升了代码生成能力。Google发布文本生成视频模型Lumiere,生成视频在运动幅度和一致性表现良好。微软集中公司内部顶尖AI研究人员力量,组建新的GenAI团队研发小模型,减少对OpenAI的依赖。Adept AI发布多模态模型Fuyu-Heavy,官方称跑分表现仅次于GPT4-V和Gemini Ultra。

同时,国内大模型也有不少进展,通义千问团队升级了视觉语言模型Qwen-VL,图片内文字处理能力得到提升。此外,第四批国产AI大模型备案获批,14款大模型及产品获得备案审批,备案企业已经从以大厂、AI厂商、AI研究机构为主,快速覆盖到了各个垂直行业。

另外,苹果本周宣布在欧洲地区做出重大更新,允许第三方应用商店在iOS设备上运行,这是2008年以来苹果首次针对第三方下载问题做出让步。

融资方面,本周AI领域融资较为活跃,成立仅两年的语音AI初创公司ElevenLabs获8000万美元融资,跻身AI独角兽俱乐部。此外,初创公司Sierra完成了由红杉资本领投的A轮投资,估值将达10亿美元。

Key Points

  • 微软组建新团队来造更轻且便宜的AI模型

  • OpenAI大降价,同时发布多项更新

  • Google团队发布文本生成视频模型Lumiere

  • Adept AI发布多模态模型Fuyu-Heavy,跑分测试表现出色

  • 通义千问视觉语言模型Qwen-VL系列升级

  • 第四批国产AI大模型备案获批,更多垂直厂商入局

  • OpenAI悄悄放弃向公众披露关键文档的承诺

  • 苹果计划在欧洲地区开放第三方应用商店

  • 蚂蚁成立Al创新部NextEv,负责人系前GoogleAl工程师

  • Google更新Chrome浏览器,将新增3个AI功能

  • 又有三名Google DeepMind员工离职创业

  • 语音AI初创ElevenLabs获8000万美元融资,新晋独角兽

  • OpenAI董事成立的公司Sierra获8500万美元投资,红杉资本领投

  • AI摄影应用Artisse AI筹集670万美元种子资金

  • AI初创Fusemachines宣布以SPAC方式在美上市

  • 腾讯文档 AI 开启公测,支持一句话生成Word/Excel/PPT

  • Google发布Art Selfie2.0版本,自由创建艺术自拍

  • 苹果计划在2028年推出第一款电动汽车Apple Car

  • Pika联手北大斯坦福发表论文,开源文生图框架

大模型第一线

微软组建新团队来造更轻且便宜的AI模型

1月23日,据The information援引两位知情人士消息,微软正在组建新的GenAI团队,将专注于开发更小的语言模型(SLM) ,该团队将由微软公司副总裁Misha Bilenko领导,微软内部多名顶级研究人员已加入该团队。分析认为微软希望通过这种方式节约成本,并减少对OpenAI的依赖。

OpenAI大降价,同时发布多项更新

1月25日,OpenAI宣布将于下周推出全新GPT-3.5 Turbo模型,将输入价格降低了50%,输出价格降低25%,这也是GPT-3.5 Turbo在一年内的第三次降价。OpenAI还更新了GPT-4 Turbo预览模型,能更好完成代码生成类任务。另外,两款全新文本嵌入模型text-embedding-3也上线了,OpenAI还将更新API使用和管理方法,让开发人员更清楚地了解API使用情况。

△智能涌现制图

Google团队发布文本生成视频模型Lumiere

1月24日,Google研究员Hila Chefer在社交媒体X上宣布,文生视频模型Lumiere正式上线。研究团队为Lumiere引入了时空U-Net架构,使得生成视频在运动幅度和一致性表现良好,同时提供多种风格选择,支持生成内容的局部修改。

Adept AI发布多模态模型Fuyu-Heavy,跑分测试表现出色

1月24日,Adept AI发布了最新的多模态模型Fuyu-Heavy,并称目前其能力是全球排名第三的多模态模型,仅次于GPT4-V和Gemini Ultra,但其规模仅为它们的1/10-1/20。Fuyu-Heavy在基准测试跑分中表现突出,部分得分超过Gemini Pro。Adept成立于2022年,创始人包括Google Transformer架构的提出者Ashish Vaswani和Niki Parmar,及OpenAI前工程副总裁David Luan。

通义千问视觉语言模型Qwen-VL系列升级

1月22日,阿里云通义千问团队公布了视觉语言模型Qwen-VL系列的更新。此次更新包含Qwen-VL-Plus和Qwen-VL-Max两个版本,模型在图像相关的推理能力、图中文字识别和提取能力,以及支持高分辨率三个方面做了升级。据通义千问数据,相比于开源版本的Qwen-VL,这两个模型在多项图文多模态标准测试中获得了堪比Gemini Ultra和GPT-4V的水准。

第四批国产AI大模型备案获批,更多垂直厂商入局

1月26日,36氪获悉,国内新一批通过大模型备案审批的企业名单正式出炉,包括13家企业的14款模型及产品获得备案审批。从2023年8月第一批企业和机构算起,本次公布已是第四批的企业名单。同时,备案企业已经从以大厂、AI厂商、AI研究机构为主,快速覆盖到了各个垂直行业,其中电商零售、社交、招聘等细分赛道的公司较为活跃。

△智能涌现制图

大事件

OpenAI悄悄放弃了向公众披露关键文档的承诺

据《连线》杂志1月24日消息,在公司董事会会议结束后,OpenAI拒绝了《连线》杂志要求提供完整财务信息的请求。在此之前,OpenAI向美国税务当局提交的报告曾称,任何公众都可以查看公司管理文件、财务报表等文件的副本。但OpenAI负责人表示,其信息公开政策自2022年后已经改变,并只提供了一份略去大部分业务的财务报表副本。

苹果计划在欧洲上线第三方应用商店

1月25日,苹果公司宣布将允许欧洲地区第三方应用商店在 iOS上运行,以响应欧盟将于三月生效的《数字市场法》(DMA),这是2008年以来苹果首次针对第三方下载问题做出让步,也将打破苹果应用商店作为iPhone应用程序唯一分销商的地位。同时,开发者可以选择继续使用苹果的支付服务和应用内购买,或整合第三方支付系统,而无需向苹果支付额外费用。

蚂蚁集团成立Al创新部NextEv,前GoogleAl工程师徐鹏担任负责人

1月24日,36氪独家获悉,蚂蚁集团已在内部成立了A创新研发与应用部门NextEvO,由蚂蚁集团副总裁徐鹏担任负责人。徐鹏曾在Google工作11年,负责和领导了Google翻译的核心技术研发,并参与了显示广告系统的算法研发。NextEvo是蚂蚁内部的Al精税部门,承担了蚂蚁Al的所有核心技术研发,包括蚂蚁百灵大模型的所有研发工作。

Google更新Chrome浏览器,将新增3个AI功能

1月23日,Google发布Chrome M121版本,并宣布将引入3个新的AI功能。新增功能包括本周上线的标签管理器,将在下个月上线的文本写作助手功能,以及在浏览器中自定义主题的功能。早在去年9月,微软Bing就推出了基于人工智能的标签分组和文本组合助手,但是Chrome仍然在美国浏览器市场上占有绝对优势,此举也有助于Chrome巩固其市场份额。

又有三名Google DeepMind员工离职创业

1月24日,据The information援引两位知情人士消息,三位DeepMind研究人员近期离开Google,创办了人工智能初创企业Uncharted Labs。此前,他们在Google负责开发生成图像和音乐的相关研究工作。消息人士称,新公司已经在2个月内筹集到了850万美元。近期员工流失问题也引起了Google管理层的注意,他们正在通过加薪和授予股票激励的方式留住AI人才。

融资动态

语音AI初创公司ElevenLabs获8000万美元融资,新晋AI独角兽

1月22日,成立于2022年的AI语音初创公司ElevenLabs正式宣布,已经完成了8000万美元的B轮融资,投资方包括Andreessen Horowitz、Nat Friedman和Daniel Gross,红杉资本等。ElevenLabs能够将文本转换成语音,并且支持多种模仿不同年龄、性别等人的语音、口音甚至情感,让电影配音更加像“真人”,其客户包含不少游戏巨头和电影制片厂。

OpenAI董事成立的公司Sierra获8500万美元投资,红杉资本领投

据彭博社1月26日援引知情人士消息,企业级人工智能初创公司Sierra近期完成了A轮投资,红杉资本预计将领投8500万美元的投资,如果融资完成,Sierra估值将达10亿美元左右,成为新的独角兽。Sierra由Salesforce前联席CEO Bret Taylor和Google高管Clay Bavor在去年联合创立,公司的具体业务尚未有更多公开信息。

AI摄影应用Artisse AI获670万美元种子轮融资

据TechCrunch1月24日消息,AI照片生成应用Artisse筹集到了670万美元的种子资金,由伦敦基金会(The London Fund)领投。Artisse允许用户上传自己的照片,然后生成不同姿势和风格的照片,其相对于同类软件的优势是真实感更强。到目前为止,这款应用已经被下载了超过20万次,用户最初可以享受25张免费照片额度,后续每生成一张照片收费20美分。

AI初创公司Fusemachines宣布以SPAC方式在美上市

1月23日,企业人工智能产品和解决方案提供商Fusemachines与特殊目的收购公司CSLM Acquisition Corp.宣布签署业务合并最终协议,帮助Fusemachines以SPAC方式在纳斯达克上市,该交易估值约为2亿美元。Fusemachines成立于2013年,公司利用专有的AI Studio和AI引擎,帮助推动客户的AI企业转型,其客户包括时代杂志出版商、Coach母公司Tapestry等。

新玩意

腾讯文档AI开启公测,支持一句话生成Word/Excel/PPT

1月26日,腾讯文档智能助手正式开启公测,全面应用于Word、Excel、PPT、PDF、智能文档、收集表、思维导图等文档类型。此次公测腾讯文档AI能力带来全新升级,涵盖了文本内容秒级处理、函数公式运算应用、表格数据精准呈现、PPT快速生成美化、收集结果自动分析、思维导图一键生成等多项能力,并支持跨品类文档内容畅通流转。

Google发布Art Selfie2.0版本,人人都可以创建自己的艺术自拍

1月24日,Google旗下应用艺术与文化(Arts & Culture)上线了Art Selfie2.0版本,让用户利用生成式AI技术生成艺术品风格的自拍,目前该应用支持超过25种艺术风格。2018年,Google就推出了Art Selfie1.0,帮助用户在艺术史上找到自己的翻版,此次更新的重点是加入了AI功能,同时在生成照片时让用户可以了解到相关艺术风格的历史。

苹果计划在2028年推出第一款电动汽车Apple Car

据彭博社1月23日消息,苹果预计在2028年推出其第一款电动汽车Apple Car,并支持部分自主驾驶功能。苹果电动汽车项目“泰坦计划”(Project Titan) 自2015年以来一直在进行,但该项目面临多次延误和高管更替。彭博社称,苹果董事会去年向库克施压,要求其提供泰坦计划的交付计划,或者完全取消该项目。报告称,该项目最初的计划是制造一款没有方向盘的全自动汽车,但此前从未产出过可行的原型。

前沿研究

Pika联手北大斯坦福发表论文,开源文生图框架

1月24日,Pika研究中心在社交媒体X上发布动态,宣布Pika与北京大学、斯坦福大学合作开发的文本生成图像框架RPG-DiffusionMaster上线,同时文章和代码均已开源。RPG框架在上下文和组合语义对齐方面取得了显著的进步,还支持多轮对话编辑功能。

论文地址:
https://arxiv.org/abs/2401.11708

👇🏻 扫码加入「智涌AI交流群」👇🏻

36氪旗下AI公众号

👇🏻 真诚推荐你关注 👇🏻

继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存