您的位置:全球 美股 / 港股 / 外汇 / 期货 / 黄金 > 引爆A股的Sora到底是啥?一文看懂

引爆A股的Sora到底是啥?一文看懂

2024-02-20 08:56  来源:中国证券报 本篇文章有字,看完大约需要 分钟的时间

来源:中国证券报


  2月19日,Sora概念股掀起涨停潮。该AI视频模型系日前OpenAI发布的“核弹级”产品,文生视频60秒一镜到底,效果堪称“炸裂”!中证君收集了多个市场最关心的问题,让我们一起看看机构和业内人士如何剖析Sora。

  Sora到底是什么?

  2月16日,OpenAI发布文生视频模型Sora。它能够根据用户输入的提示词、文本指令或静态图像,生成长达一分钟的视频,其中既能实现多角度镜头的自然切换,还包含复杂的场景和生动的角色表情,且故事的逻辑性和连贯性极佳。

  OpenAI一共展示了48个文本生成的视频。如:

  文本提示:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。

引爆A股的Sora到底是啥?一文看懂

  OpenAI视频截图

  工银瑞信:AI视频生成的难点在于,一方面视频是连续的多帧图像,并且要有逻辑性,并非简单的图片组合;另一方面是带来模型复杂度提升、计算难度和成本的提升。此外,文生视频需要大量的“文本-视频”配对数据,而目前缺乏多样化的数据集,且数据标注的工作量较大。因而此前视频大多为5-15秒,而Sora将视频时长提升至1分钟,支持生成多个镜头,同时基本维持了角色和视觉风格的一致性,并能在一定程度上“理解”现实世界。

  国泰君安:Sora具有三大突出亮点:一是60秒长视频,可以保持视频主体与背景的高度流畅性与稳定性;二是在一个视频内实现多角度镜头,分镜切换符合逻辑且十分流畅;三是理解真实世界的能力,对于光影反射、运动方式、镜头移动等细节处理得十分优秀,极大地提升了真实感。

  Sora发明者之一是天才少年谢赛宁?

  2月19日,针对有自媒体称Sora发明者之一是毕业于上海交大的天才少年谢赛宁,谢赛宁本人通过朋友圈对此进行否认称,一点关系都没有,是该自媒体标题党AI写稿,胡乱挂钩,误导事实。

  OpenAI官网披露的Sora技术团队信息显示,Sora团队由Peebles等3人领导,核心成员包括12人,其中有多位华人。不过谢赛宁不在名单中。

  Sora的技术思路与其他产品有何不同?

  工银瑞信:技术角度来看,Sora采用了“扩散+Transformer”的视频生成大模型技术路线,可谓有了里程碑式的技术进步。相比以往使用的同为扩散模型的U-Net,Transformer架构的参数可拓展性强,即参数量增加,性能加速提升,同时支持任意分辨率、长宽比、时长的视频训练数据,不会因为压缩导致训练数据质量下降。此外,Sora训练了能在时间和空间上压缩视频的自编码器,这也是其能够大幅提升生成视频时长的原因。

  360集团创始人周鸿祎:Sora的技术思路完全不一样。之前做视频做图用的都是Diffusion,是多个真实图片的组合。这次OpenAI利用其大语言模型优势,把LLM和Diffusion结合起来训练,让Sora实现了对现实世界的理解和对世界的模拟两层能力,这样产生的视频才是真实的,才能跳出2D的范围模拟真实的物理世界。

  Sora有何商业价值?

  安爵资产董事长刘岩:Sora模型的出现预示着行业变革的来临。在内容创作与媒体领域,它将彻底改变视频制作的传统方式,助力创作者以更高效、更低成本的方式创作出高质量视频,从而推动整个行业的工作效率提升。对于广告、电影预告片和短视频等行业,Sora模型更是可能带来颠覆性的创新。同时其在模拟世界方面的能力为虚拟现实、游戏开发等领域开辟了巨大的潜力空间。

  工银瑞信:商业角度来看,从“idea或IP→内容生产→内容分发”的产业链,长期预计视频生产的成本将大幅降低。目前AI生成视频的水平还有待提升,可能更适合做对视频质量要求低的互联网广告素材,如游戏买量素材等。由于Sora基本处于闭源状态,技术细节并未公布,相比于GPT有较多开源模型而言,国内视频生成模型方面尚有差距,利好有idea但落地较慢的动画电影公司、IP公司,以及能够降本增效的游戏行业。

  周鸿祎:Sora有强劲的大模型做底子,基于对人类语言的理解,对人类知识和世界模型的了解,再叠加很多其他的技术,就可以创造各个领域的超级工具,比如生物医学、蛋白质和基因研究,包括物理、化学、数学的学科研究上,大模型都会发挥作用。这次Sora对物理世界的模拟,至少将会对机器人具身智能和自动驾驶带来巨大的影响。

  A股Sora概念股怎么看?

  云从科技:目前,从容大模型已实现利用diffusion、GAN等生成式技术围绕人物图像、人物视频数据进行建模,通过文本和音频实现对图像和视频内容进行生成、控制、编辑。应用上,云从科技与天津港、华为等共同开发港口大模型PortGPT,核心是AI智能体天天,通过AI生成交互画面,协同数据分析,提高港口运转效率及安全性。此外,还在文生图像、视频等跨模态领域积极布局,包括发布数字人能力平台,生成AI视频;与中国电信合作AI营销海报生成等。

  博汇科技:公司一直在积极关注Sora相关业务的布局及发展。目前,公司业务主要在传媒安全领域,有两个方向:一方面是针对音视频内容运维提供保障,另一方面是针对音视频内容的监管。目前Sora相关产品处于初级阶段,未来的应用还有待进一步研究。Sora后续如果应用场景比较宽泛,产生的视频数据量将有所增长,对产业将有一定促进。

  因赛集团:预计于2024年3月底前,开发实现文生视频功能,之后推出公测版正式启动商业化。公司目前已收到几家汽车、快消行业知名品牌方发出的AIGC营销项目投标邀请,后续会在确保生成效果和效率的前提下,加快 InsightGPT的商业化进程。

  汉王科技:Sora目前属于比较前沿的动态,汉王一直在人工智能领域耕耘。公司有自己的核心技术,比如文本识别、图像识别、视频分析等多模态识别技术,并已在多领域进行应用。在识别解析技术方向,公司有自己的大模型(汉王天地),主要在垂直领域进行应用。

  Sora将为AI赛道带来什么投资机会?

  止于至善投资总经理何理:Sora的发布有望再度掀起AI上涨热潮。尽管Sora的视频时间仅有一分钟,但按照OpenAI的迭代速度,生产出几十分钟的AI视频也不远了。未来数年内,将对整个影视制作和短视频行业带来颠覆性冲击。目前AI热潮已进入第二阶段,重点在于产品层面的AI创新以及数据层面的业绩检验。未来行情的爆发属于应用端与基建端并举,应用端重点关注与AI融合较好的TOB端应用,基建端主要关注GPU、光模块、液冷、数据要素等。

  中信建投证券:AI仍然是当前科技投资的主线,海外AI大模型和应用保持较快迭代速度,随着Sora、Gemini 1.5 Pro 等大模型的发布,多模态能力显著增强,应用场景进一步拓宽,这将带动算力基础设施的投资,建议关注光模块、ICT基础设施等板块。

  申万宏源:对于短视频UGC平台,借助AI升级剪辑工具拉动创作者经济的进一步发展,但也需关注是否会有竞争的变化。对于深度内容受益,IP价值提升,对浅显低门槛内容竞争加剧。对创意工具,应对竞争的要素是B端客户粘性和版权库积累。AI造假或影响新闻生产和传播,识别AI视频将是内容审核关键环节。可关注光通信产业链、算力设备产业链、多模态算法布局、有丰富IP储备的深度内容创作、商业化AI应用场景的美图等方向。

  招商基金:AI赛道大概率仍是未来一段时间的主线之一,后续仍可重点关注AI产业链内算力与应用的配置机会。

  博时基金:受海外AI应用取得突破性进展的催化,AI板块走势强劲。当前AI板块的产业逻辑较为顺畅,后续的增长持续性或有望提升,业绩也有可能超预期,相对看好其未来表现。更多股票资讯,关注财经365!


阅读了该文章的用户还阅读了

热门关键词

为您推荐

行情
概念
新股
研报
涨停
要闻
产业
国内
国际
专题
美股
港股
外汇
期货
黄金
公募
私募
理财
信托
排行
融资
创业
动态
观点
保险
汽车
房产
P2P
投稿专栏
课堂
热点
视频
战略

栏目导航

股市行情
股票
学股
名家
财经
区块链
网站地图

财经365所刊载内容之知识产权为财经365及/或相关权利人专属所有或持有。未经许可,禁止进行转载、摘编、复制及建立镜像等任何使用。

鲁ICP备17012268号-3 Copyright 财经365 All Rights Reserved 版权所有 复制必究 Copyright © 2017股票入门基础知识财经365版权所有 证券投资咨询许可证号为:ZX0036 站长统计