查看原文
其他

Runway、Midjourney、Stability AI 发布重大更新,多模态生成式 AI 正在井喷

Founder Park Founder Park 2023-11-10
本周最为关注的大模型动态,是几家文生图、文生视频等多模态生成 AI 公司发布的新产品和新功能。Runway 的视频生成工具 Gen-2 发布新更新,生成视频直接到了 4K 清晰度,并且克服了以往生成工具存在的种种缺点,堪称里程碑式的更新。

其他值得关注的还有 Stable Diffusion、Midjourney 和 Luma AI 的新功能更新。


Runway

Gen-2 新功能颠覆 AI 生成视频,秒出 4K 大片

11 月 3 日,Runway 家标志性的 AI 视频生成工具 Gen-2 迎来了大功能更新,官方宣称「在文生视频和图生视频中,为结果的保真度和一致性带来了重大改进。」看似轻描淡写,但不少人认为这是「生成式 AI 的关键时刻」。

从演示视频可以看出,这一次 AI 生成视频的效果已经克服了以往「一眼 AI」的缺点,即不连贯、闪烁变形以及低清等等。本次里程碑式更新,虽然没有带来新的功能,但在真实性和一致性上的飞跃,使得最新版本的 Gen-2 依旧是一款划时代的产品。

在此次更新发布后,Runway 创始人兼 CEO Cristóbal Valenzuela 更是在𝕏中表示,「创意软件已死」。

Gen-2 体验地址:

https://research.runwayml.com/gen2


Stable Diffusion

发布Stable 3D 功能,自由生成 3D 对象

Stable AI 宣布推出可生成 3D 对象的工具和一系列新功能。

具体来讲,Stability AI 新增了以下几种新 AI 工具和新功能:

  • Sky Replacer 工具:允许用户更改原始照片中天空的颜色和美学效果。

  • Stable 3D:通过选择一张图像或插图,或者编写一段文本 prompt 来生成 3D 对象。

  • Stable FineTuning:帮助企业用户加速特定用例的图片、对象和风格微调。

此外,Stability AI 现在正将不可见(隐形)水印和内容凭证集成到其 API 中,tigaoAI 生成内容的透明度。

本次推出的 Stable 3D 私人预览版,能够自动生成 3D 对象,消除了大部分复杂度,允许非专业人员通过选择一张图像或草图或者编写一个文本 prompt,在几分钟内生成一个草稿质量的 3D 模型。

Stable 3D 创建的对象会设置为「.obj」标准文件格式,并可以在 Blender 和 Maya 等 3D 工具中进一步编辑和改进,或者导入到虚拟引擎 5 或 Unity 游戏引擎中直接使用。


Midjourney‍

新增 Style tuner 功能,用户可定制图像风格

Midjourney 新增了 Style tuner 功能,用户‍可以定制图像风格了。

定制好的风格被压缩成一行代码,只要在 prompt 最后粘贴这行代码,就能让生成的图保持定制化风格。

此外,自定义的风格代码还可以共享,网友认为以后风格共享都能取代提示共享了。


Luma AI

文字生成 3D 模型,Discord 免费体验

3D 生成领域里的明星公司 Luma AI 近日推出 Genie——文字生成 3D 模型,可以供用户在 Discord 里免费使用。

交互体验类似 Midjourney,虽然生成的 3D 模型效果仍算不上完美,但是能够在 Discord 免费尝试,还是大大降低了门槛。另外模型生成的速度很快,经过测试在 10 秒左右,这是现在传统方法相比的一个巨大进步。

测试期间免费使用

网址:https://lumalabs.ai/genie



如果你关注大模型领域,欢迎扫码加入我们的大模型交流群,来一起探讨大模型时代的共识和认知,跟上大模型时代的这股浪潮。



更多阅读
Sam Altman是这个时代的奥本海默吗?
470亿美元估值到申请破产:WeWork的大败局是如何造成的?
万字解析 AI Agent:如何重构千亿美金市场,掀起软件生产革命?
纳德拉讲述Bing血泪史:有谷歌在,付出再多钱和努力,苹果、三星也不会选择我们
a16z:AI 大佬们如何看待 AGI 的当下及未来?

转载原创文章请添加微信:geekparker
继续滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存