设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

五大问题让你明白,我们谈论Sora时是在谈论什么

2024-02-26 12:10:28 来源: 新快报

龙年第一热词:SorazJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

甲辰龙年迎新,最为吸睛的科技圈大事当属横空出世的文生视频模型Sora。2月16日凌晨,OpenAI官方发布了文生视频模型Sora。与之前市面上的同类工具相比,Sora具有完成更加复杂任务的能力,还能带来更为生动的多视角视频,在生成视频的时长、流畅度和逻辑性等方面优势显着。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

有趣的是,Sora发布后,美股知名工具软件公司Adobe股价随即暴跌超7%,图片版权公司Shutterstock跌逾5%,市值一夜蒸发超7000万美元,奈飞、迪士尼等影视公司和数据资产企业Getty Images等股价亦有不同程度的下跌。而国内A股,龙年甫一开市相关AI概念股就掀起涨停潮,不少蹭上Sora概念的小市值公司更是连续斩获涨停。不同市场不同企业股价走势的强烈反差,提醒着大家,对Sora应该有更多的“冷思考”:和过去两年间同样掀起大量讨论的ChatGPT、Midjourney等工具相比,Sora有何过人之处?又是否真能如一些人所鼓吹的那样,“将掀起另一次工业革命”?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

1zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

都是“文转片”,Sora牛在哪?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据OpenAI发布的示范,只需要给Sora一段二三十字的指令,它就可以生成一段长达一分钟的影片,可以是写实影片,可以是动画,也可以是历史片﹑黑白片﹑3D科幻片。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

看到这里,一些“AI神教”信奉者已经迫不及待预言,在不久将来,所有人都可以随时随地生成影片,即是说拍摄﹑绘画﹑剪片制片的门槛将不再存在。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

可是,通过“文字指令”来生成“影片”这件事情,Sora并非全球首家,过去Google、Meta或是创业公司Runway ML都有展示出类似的技术。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

不过,在看到公布的几十条示范视频的逼真性和清晰度后,很多人还是被震撼到了。比如那条雪地上撒欢的大狗,毛发丝丝闪亮发光,很具有“大片质感”。这一效果放在电影工业中,像科幻大片《阿凡达》中人物飘逸的长发,那是一大批人一笔笔画了好几个月后,在电脑帮助下制作出来的,Sora却是自动即时生成。再加上“60秒超长长度”“单视频多角度镜头”“充满情感的角色”“高度拟真的细节”和“世界模型”等等优势,对pika、Runway、Stable Video等同行竞品堪称“降维打击”。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

有网友在评论时称,“gg Pixar(皮克斯动画制作公司完蛋了)”。连和OpenAI向来不对付的马斯克,在看到Sora作品后,也写下评论谓“gg humans(人类完蛋了)”。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

2zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

技术上有何过人之处?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在技术层面,据记者了解,Sora的核心技术主要包括Diffusion Transformer架构和时空patches。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

OpenAI的技术报告显示,基于Diffusion Transformer,从一开始看似静态噪声影片出发,经过多步骤的噪声去除过程逐渐生成影片。而时空patches将不同类型的视觉数据转化为统一的表现形式。同时,该模型对语言有着深刻的理解,能够准确地演绎提示内容,并生成情感表达充分且引人注目的角色。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这可能不太好理解,源码资本在一份报告中通过三个步骤的一系列比喻进行了解释,让大众读者更容易明白一些:zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

第一步,想象一下,你正在对一间杂乱无章的房间打扫整理,方法是用尽可能少的盒子装下所有东西,同时确保日后能快速找到所需之物。视频压缩网络正是遵循这一原理。它将一段视频的内容“打扫和组织”成一个更加紧凑、高效的形式(即降维)。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

接下来,你会为每个盒子编写一张清单。这样,当你需要找回某个物品时,只需查看对应的清单,就能快速定位它在哪个盒子里。在Sora中,类似的“清单”就是空间时间潜在补丁。通过视频压缩网络处理后,Sora会将视频分解成一个个小块,这些小块含有视频中一小部分的空间和时间信息,就好像是对视频内容的详细“清单”。这让Sora在之后的步骤中能针对性地处理视频的每一部分。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

最后,想象你和朋友一起玩拼图游戏。这个游戏的目标是根据一段故事来拼出一幅图,每人负责一部分。最终,大家将各自的拼图部分合并,形成一幅完整的图画。在Sora的视频生成过程中,Transformer模型正扮演着类似的角色。它接收空间时间潜在补丁(即视频内容的“拼图片”)和文本提示(即“故事”),然后决定如何将这些片段转换或组合以生成最终的视频,从而讲述文本提示中的故事。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

通过这三个关键步骤的协同工作,Sora能够将文本提示转化为具有丰富细节和动态效果的视频内容。不仅如此,这一过程还极大地提升了视频内容生成的灵活性和创造力,使Sora成为一个强大的视频创作工具。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

浙商证券电子首席分析师蒋高振概括说:“Sora主要有四方面的突破:其一,视频生成视频。Sora可以依据原视频,用自然语言对其进行修改,以达到更换环境、天气等元素的目的。其二,向过去拓展视频。过去类似产品主要是向未来拓展,而Sora可以向过去拓展,同时保持结尾的一致性。其三,视频拼接。Sora可将不同种类的视频拼接至同一视频的统一场景下。其四,具有交互反馈。”他认为,此次Sora在时长和效果上,均有了更加接近人类拍摄视频的效果。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

3zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Sora是否被“神化”了?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

如果只是“文生片”的超能力,Sora不太可能成为今天这么火爆的话题,关键点是OpenAI的技术报告最后提到,当模型在大规模数据上训练后,模型表现出许多有趣的新兴能力,这些能力使得Sora能够模拟现实世界中人类、动物和环境的某些方面。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

也就是说,模型训练前并没有给它输入一些物理规则,然而模型在接受大规模数据的训练后,自然而然学习到了这些物理规律。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

例如,随着相机的移动和旋转,人物和场景元素在三维空间中保持一致地移动。视频主体在暂时地被遮挡或者离开画面后,后续也能继续存在,并且也能保证主体在多个镜头画面中,保持外形的一致性。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Sora有时还能够模拟以简单方式影响世界状态的行为。例如,画家可以在画布上留下随时间持续的新笔触,或者一个人吃汉堡时能留下咬痕。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

技术报告最后的结论是,Sora的这些示例,无论是模拟真实场景还是虚拟场景,大部分都体现了物理规律。这表明基于Transformer的Diffusion模型,是发展世界模型的一条可行道路。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这一结论直接被英伟达AI研究院首席研究科学家Jim Fan解读成,“这是一个数据驱动的物理引擎。它是对许多世界的模拟,无论是真实的还是幻想的。”他认为,Sora是一个可学习的模拟器,或“世界模型”。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

正是为此,国内外学术界、产业界展开了激烈争论。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

激进者如360集团董事长周鸿祎认为,Sora展现的不仅仅是一个视频制作的能力,它展现的是大模型对真实世界有了理解和模拟之后,会带来新的成果和突破。“一旦AI接上摄像头,把所有的电影和视频都看一遍,对世界的理解将远远超过文字学习,这就离AGI(通用人工智能)真的不远了,不是10年20年的问题,可能一两年就可以实现。”zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Meta首席科学家杨立昆则质疑说:“仅凭能够根据提示生成逼真的视频,并不能说明系统真正理解了物理世界。生成过程与基于世界模型的因果预测不同,生成式模型只需要从可能性空间中找到一个合理的样本即可,而无需理解和模拟真实世界的因果关系。”zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

猎豹移动董事长傅盛表示,Sora这次的重大突破并不代表技术上的重大升级,更可以理解成是一个暴力美学。文生图和文生视频引擎,目前对世界的理解还停留在初级水平,可能只是通过生成符合人类感官的图像来表现,而不是真正的理解。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

4zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

概念股该狂飙还是该瑟瑟发抖?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

撇开Sora是否真能“理解世界”不说,OpenAI此次发布的Sora只能算是个预览版,目前仅向部分设计师和电影制作人等特定人群提供访问权限,以获取改进反馈。公司不仅未公布训练Sora模型的数据等基础细节,也没确定何时面向公众发布。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

即使如此,美国一些分析人士认为,AI在视频生成领域的巨大发展前景为塑造影视产业新业态打开大门的同时,恐将颠覆现存影视产业。相关分析使得主营图像处理、视频制作软件的Adobe公司股价应声下跌超过7%。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在中国,Sora发布适逢龙年春节长假。假期一过,各大券商机构就迫不及待释放研报吹捧Sora,并顺势推荐相关概念股。多家机构认为,考虑到视频数据量相对文本和图片有几何级的提升,AI视频生成对训练和推理的算力需求将大幅提升,算力厂商有望持续受益,包括高新发展、恒为科技、中科曙光、工业富、寒武纪、海光信息、利通电子收涨,浪潮信息、景嘉微、龙芯中科、紫光股份等股价均一度大涨。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

这些机构还指,若Sora成为视频创作领域的超级应用,将带来巨大的网络设备升级需求,从而打开龙头厂商估值空间。光模块概念股的中际旭创、天孚通信、新易盛、源杰科技、联特科技等全数收获涨停。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

从产业角度来看,经济学家任泽平在《Sora横空出世,会颠覆哪些行业?》一文中分析指出,以后“扔一部小说、出一部大片”不是不可能了,在当下的短视频时代,Sora“一个人”就全包了短视频的摄影、导演、剪辑等任务。未来,Sora生成的各种不同用途的视频,对于现在的短视频、直播、影视、动漫、广告等行业都会产生深远影响。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

比如,在短视频创作领域,Sora有望极大降低短剧制作的综合成本,解决“重制作而轻创作”的共性问题;广告制作公司通过Sora 模型生成符合品牌的广告视频,显著减少拍摄和后期制作成本;游戏与动画公司使用Sora直接生成游戏场景和角色动画,减少了3D模型和动画制作成本。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

对此,巨人网络在回应记者时表示,短期来看,作为生产力工具,Sora有望极大提高游戏行业内容创作效率;长期来看,Sora涌现出对3D模型的理解以及强大的物理世界仿真能力,会对游戏底层工具层面产生深远影响。公司目前已将自研AI视频风格迁移技术广泛应用于研运环节,赋能内容创意表达。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

微盟集团相关技术负责人表示,Sora将重塑短视频营销产业。可以预见,随着Sora等AI大模型加持下视频生成能力的“智能化”发展,视频拍摄于制作尤其是线下部分场景可由技术生成或扩展,从而大大缩减线下实体场地和维护团队的支出成本,同时极大地释放视频类广告素材的制作生成效率,由此带来的“降本和提效”,有望推动AI视频生成技术快速进入商业化应用阶段。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

近年来借微短剧走红海内外的中文在线则在投资者关系活动中表示,该公司拥有IP,未来或可运用Sora或类似应用生成短剧/短视频,通过其现有成熟短剧或短视频营销等商业路径进行规模化、商业化的变现。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

5zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

还有什么在限制着Sora?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

Sora首次发布展示虽然堪称惊艳,但其生成能力并不完美也是显而易见的。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

根据已披露的影片显示,不少素材仍属“一眼假”,不符合物理学规律等AI生成的Bug不少。例如,在呈现“红酒杯在桌上摔碎”的镜头中,杯子摔碎前红酒已洒满桌子,违背了物理逻辑;在一个女人走在街上的片段中,背景中有许多模糊的人,但如果再仔细观察,他们看起来就像是四处漂浮的僵尸,在大约28秒的时候,这个女人的左脚迈出了两步,这在生物学上是不可能的;另一段视频展示的蚂蚁只有四条腿,而大多数正常蚂蚁都有六条腿。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

同时,与文本对话和图片生成相比,训练成本高昂、高质量数据集的缺乏、影片描述的模糊性和复杂度以及知识产权合规或输出内容不侵权等,都将是Sora需要跨越的门槛及挑战。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

实际上,任何人都可以轻松地将文本转换为视频,这一想法既令人兴奋,也让人感到害怕。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

在美国,随着名人、政客等人物的深度造假视频在网上变得越来越普遍,相应的伦理和安全问题也让人心惊,尤其是在总统选举年和紧张的政治局势背景下,这些工具很可能会植入社会偏见和仇恨内容。可能AI制作的视频仍会有一些不一致的地方,但普通人可能根本不会注意到这些细节。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

美国联邦贸易委员会2月15日提出了禁止使用AI工具冒充个人的规则。FTC表示,它正在提议修改一项已经禁止冒充企业或政府机构的规则,将保护范围扩大到所有个人。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

国内也有不少法律界人士表态称,Sora的开发和使用过程中或许会侵犯他人著作权、隐私权,违反数据保护相关法律,此外或许还会出现人权与伦理问题。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

就以近日网友们津津乐道的“给Sora看一遍金庸的作品,100集的《射雕英雄传》就出来了”为例,据知名IT专业律师赵占领分析指出,如果视频是根据小说内容生成一个相应的视频,它实际上是构成侵权的,“这种实际上和小说改编成影视剧是类似的性质,侵犯的是改编权”。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

除此之外,由于目前OpenAI并没有公布Sora具体的算力、能源消耗需求以及参数量,初步判断,它需要的数据量、算力以及能源消耗将是巨大成本,而这与其下个阶段的开发和推广必然存在矛盾。有消息指,在Sora发布前夕,OpenAI首席执行官Sam Altman正寻求最高7万亿美元募资,以重塑全球AI芯片的基础设施。zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

记者观察zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

它为什么没有诞生在中国?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

和一年前ChatGPT成为节后火爆话题相似,今年Sora的走红,又带起了一波话题:为什么Sora没有诞生在中国呢?zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

一度被误传为Sora发明者之一的毕业于上海交大、现任纽约大学计算机科学助理教授谢赛宁在澄清传闻时谈到,“对于Sora这样的复杂系统,人才第一,数据第二,算力第三,其他都没有什么是不可替代的。”zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

至于“在问Sora为什么没出现在中国的同时,可能也得问问假设真的出现了(可能很快),我们有没有准备好?如何能保证知识和创意的通畅准确传播,让每个人拥有讲述和传播自己故事的‘超能力’,做到某种意义上的信息平权。”zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

上海市数据科学重点实验室主任肖仰华在回应相关话题时表示,大模型需要的无外乎就是人才、数据、算力。我们国家最不缺的就是工程人才,我也不认为数据是我们的根本短板,可能现在最直接的因素还是算力上面,Sora说白了也是一个大力出奇迹的活,但我们现在算力跟不上,是一个明显的短板。“另外,我认为可能还很缺的因素,就是所谓的信心。我们中国人还是强调经济务实,都喜欢跟哪个理念一结合就能够去快速变现。这本质上还是一个信仰和信心的问题。”zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

■采写:新快报记者 郑志辉zJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

■图片:VCGzJd流量资讯——探索最新科技、每天知道多一点LLSUM.COM

本文链接:五大问题让你明白,我们谈论Sora时是在谈论什么http://www.llsum.com/show-1-5985-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 安排专车接送学生,便桥预计7-10日建成

下一篇: 储量突破2亿立方米!中国渤海深层油气勘探再获发现

热门资讯

推荐资讯

  • 飞行服怎么搭配?

    飞行服怎么搭配?飞行服是一种很有个性的服装,搭配时可以选择配以紧身裤或牛仔裤,搭配一双厚底靴子或运动鞋,或者选择一条迷彩裤或束脚裤,搭配一双军靴会显得非常酷。 上身可以

  • 男士两件毛衣怎么穿?

    男士两件毛衣怎么穿?男士两件毛衣的穿搭可以根据个人的喜好和风格来选择不同的搭配方式。以下是一些常见的搭配建议: 层次感搭配:将两件毛衣进行层次感的搭配,可以营造出更加

  • 一字肩潮流穿搭法

    一字肩潮流穿搭法1、一字肩+短裙 短裙的俏皮与一字肩的撩人结合,共同演绎出轻熟的魅力。 无论是牛仔短裙还是鱼尾裙,高腰的确是关键,打造出高腰线是拥有大长腿的法宝。如果

  • 蓝灰色最佳配色表:打造简约而高级的视觉体验

    一、引言在设计和搭配色彩时,我们常常会考虑如何通过色彩的组合来达到一种独特的视觉效果。而蓝灰色作为两种较为中性的颜色,常常被认为是最佳配色之一。本文将探讨蓝灰色的

  • 30 岁女人冬季怎么穿搭有气质?教你轻松打造优雅与时尚!

    一、引言冬季对于很多 30 岁女人来说,穿搭成了一个不小的难题。这个年龄段的女性,已经不再追求过于花哨的服饰,而是更加注重气质和品味。那么,30 岁女人冬季该如何穿搭才有气

  • 性感美女穿比基尼:如何打造令人惊艳的视觉效果

    一、引言性感美女穿比基尼,这是一个让人热血沸腾的话题。在炎热的夏季,没有什么比看到一位火辣的美女穿着比基尼在沙滩上晒太阳更让人心动的了。那么,如何才能打造出这种令人

  • 工装裤配什么上衣比较好?这三种搭配让你又潮又酷

    在时尚圈,工装裤一直是备受关注的潮流单品。那么,如何搭配上衣才能更好地展示工装裤的独特魅力呢?今天,我将为大家推荐三种又潮又酷的搭配方式,让你成为街头时尚焦点。一、工装

  • 浅蓝色搭配什么颜色好看?探索色彩的奥秘

    一、引言浅蓝色是一种清新、柔和的颜色,常常给人带来一种宁静、舒适的感觉。在日常生活中,浅蓝色系的服饰、家居用品等都非常受欢迎。那么,浅蓝色究竟搭配什么颜色才能达到最

  • 女老爹鞋配什么裤子好看?这三种搭配让你时尚又个性!

    在时尚潮流不断变化的今天,女老爹鞋已经成为了越来越多女生鞋柜里的必备单品。但是,如何搭配裤子才能更好地展示女老爹鞋的独特魅力呢?今天,我就为大家推荐三种搭配方式,让你穿

  • 工装裤搭配什么上衣女?一款时尚又实用的穿搭指南

    随着时尚潮流的不断变迁,人们对于穿搭的追求也越来越多元化。其中,工装裤作为一种休闲时尚的服饰,越来越受到女性的喜爱。那么,如何搭配工装裤才能既时尚又实用呢?本文将为您提

  • 灰色大衣搭配图片:时尚与经典的碰撞,让你成为街头焦点

    一、引言随着时尚潮流的不断演变,人们对于穿搭的追求也越来越高。在众多服饰中,灰色大衣始终以其简约、优雅的特点备受青睐。那么如何将灰色大衣穿出独特的时尚感呢?本文将为

  • 服装店陈列颜色搭配技巧:打造令人叹为观止的视觉盛宴

    随着时尚潮流的不断更迭,服装行业的竞争日趋激烈。要想在众多服装店中脱颖而出,吸引消费者的眼球,除了拥有独特的款式设计外,合理的陈列颜色搭配也是至关重要的一环。今天,就让

  • 日榜
  • 周榜
  • 月榜