12月10日凌晨,OpenAI正式发布视频模型Sora的高端加速版本——Sora Turbo,相比初代Sora,Sora Turbo生成视频速度更快。
据悉,OpenAI推出的初代Sora平均10秒生成一秒的视频,而在直播演示中,Sora Turbo同时生成四条10秒时长的视频,总耗时仅72秒。
与此同时,Sora Turbo能以更低廉的成本,实现文本/图像/视频生成视频。
即日起,Sora Turbo已向订阅OpenAI Plus和Pro的会员开放全部功能,无需额外付费,但不同会员类型的使用额度有所差异:
每月付费20美元的OpenAI Plus会员,单月共有50次视频生成额度;每月付费200美元的Pro会员,单月可慢速无限次生成视频,加速生成视频500次,如果生成高分辨率的视频,可用次数将更少。
生成视频方面也有所差异。Plus会员生成的视频分辨率最高为720p,单条视频时长为5秒;Pro会员可同时生成5条视频,分辨率达到1080p,时长则提升到20秒。
OpenAI官网显示,Sora已支持全球155个国家及地区使用,不包括中国大陆和欧洲大部分地区。
随着Sora开放使用,网友疯狂涌入导致服务器被挤爆。对此,OpenAI创始人兼CEO Sam Altman发文表示,用户注册已被关闭,并且视频生成速度将在一段时间内变慢。
一场在线视频工具教程
OpenAI团队将Sora定义为一款创意工具,允许用户通过一段文字描述、一张图片或者一段视频,生成期望的视频。
他们提到,Sora无法实现一键生成一段故事片,而是需要不断优化。为了直观介绍Sora,OpenAI将Sora发布会直播,俨然变成了在线视频工具教程。
如果用户需要生成一段视频,需要打开分镜(Storyboard),分镜展示四个视频,以不同视角展示视频细节。
在分镜中,用户在描述框输入期望的视频指令,设置风格、画面比例、时长、分镜个数、分辨率后,就能生成视频。
目前,Sora可支持生成最长20秒,分辨率为1080p的视频,画面比例可选16:9 / 1:1 / 9:16三种。
OpenAI介绍,如果用户的视频指令字数越少,Sora就会在细节上更多填充;字数越多,就更遵从用户的指令。
直播中,OpenAI在描述框中输入“一只黄尾白鹤站在小溪里”的指令,将这条视频片段放入时间轴前部分,接着在新视频输入“这只鹤将头探入水中并叼出一条鱼”指令,将其放在同一个时间轴的后部分。两段视频并不连续,因此需要Sora自行生成过渡视频,将两个视频合成为一段完整视频。
结果显示,Sora按照指令生成了清晰的视频,并在两个视频片段生成平滑的过渡片段,让视频连贯且具有故事感。不过,视频中没有生成明显的鱼,却有鹤叼起鱼时溅起的水花。
此外,用户也可直接上传一张图片或者视频,Sora可以根据内容,生成后续视频的文字描述,用户可随意更改后续视频的指令。
比如,提交一张灯塔的图片后,Sora会在之后创建一张卡片描述后续将生成的视频,用户可以更改指令,并在时间轴调整位置决定生成的视频何时播放。
初始视频生成后,用户如果需要优化,可通过remix工具改变物体,比如将猛犸象替换为机器人、更改人物表情等。为此,Sora还设置了细微、轻微、强力三种强度,以满足用户不同的更改需求。
如果用户对生成视频的部分片段满意,可使用recut工具剪辑需保留的片段,再通过指令扩充视频,从而获得一段新视频。
此外,Sora还具备loop和高级功能blend,前者允许用户让视频无限循环,Sora可生成细节让视频首尾衔接;后者可将两个完全不同的场景融为一体。
不只是工具,而是实现AGI的路径
今年2月,OpenAI首次推出初代Sora,可根据用户输入的提示词生成最长一分钟的高清视频。此后,Sora开始长达10个月的封闭测试,仅向视觉艺术家、设计师和电影制作人等特定外部人员开放。
直到此次直播开始前数小时,有关Sora的官方最新视频展示才在网络流出。
而在Sora封闭内测的时期内,中国的类似产品如可灵AI、即梦AI、海螺AI已在海外获得一批用户的认可。
据国外网站分析工具Similarweb显示,11月可灵AI的全球总访问量达到940万次,超越海外同类产品runway的710万次;在提前流出的Sora Turbo演示视频推文下,不少国外用户表示,其视频效果与中国同类产品相似。
Sam Altman曾表示,Sora的更新速度不及预期,原因在于完善模型需要确保安全性,以及扩大计算规模。
据悉,为了保证模型训练得以进行,OpenAI已与半导体公司Broadcom合作研发运行模型的人工智能芯片,最早或将于2026年推出。
Sora对于OpenAI的意义,远不止一款视频生成工具。此次直播中,Sam Altman强调,希望AI能够理解并生成视频,以改变人们使用电脑的方式,同时将有助于OpenAI实现通用人工智能(AGI)。
不过人们对这一说法看法不一。阶跃星辰CEO姜大昕曾告诉智能涌现,其理解OpenAI推出Sora是为了探索迭代多模态生成能力,因此阶跃星辰也沿着OpenAI相似的路径研究通用人工智能技术;Meta首席人工智能科学家Yann LeCun则认为,通过生成像素模拟世界的行为,浪费资源且注定失败。
通用人工智能的应用时间已在OpenAI计划表内。Sam Altman上周对媒体表示,通用人工智能的首批应用案例最快在2025年出现,人们可以设定一项非常复杂的任务,AI将使用不同工具完成。
“最初通用人工智能产生的影响可能较小,最终,其影响力之强将超乎人们所想,正如每项重大技术出现,会有大量工作岗位被替代。”
或许随着Sora的开放使用,其对于通用人工智能影响将逐渐强烈,OpenAI也将实现其最终目标。
头图|Unsplash
本文来自 智能涌现,作者田哲,编辑苏建勋,36氪出海经授权转载。
近期活动
36氪出海将于12月19日下午2:00在北京举办主题交流活动。我们邀请到来自商米科技的重磅嘉宾,为出海企业分享其成长为出海独角兽、业务覆盖200+国家和地区的的进阶之路,以及国际化业务中诸多挑战的应对之策。如果您希望深入了解企业出海的实践经验和应对国际市场挑战的方法,欢迎您扫描下方二维码填写表单,报名参加本次活动。活动报名将于12月18日中午12:00截止。
加入36氪出海学习交流群
目前,36氪出海学习交流群已经吸引超过15000位来自国内外初创企业、行业巨头、投资机构等出海人加入。在出海社群里,我们面向群成员挑选整理每日全球跨境资讯,帮助出海人把握最新动态;定期组织出海交流活动,链接出海生态圈,寻找潜在合作伙伴!欢迎添加36氪出海小助手微信(ID:wow36krchuhai-xzs2)申请入群,一同出海!