谷歌DeepMind推出4K视频模型,正面迎击Sora
近日,谷歌谷歌Alphabet部门Google DeepMind突然公布Veo 2视频模型,推出距离Veo一代发布仅七个月后,频模佛山新闻网报料热线现版本已经可以生成最高4K分辨率,型正长达两分钟以上的面迎视频。
要知道,谷歌OpenAI在一周前刚刚正式推出了Sora视频模型,推出同样经过近一年的频模打磨,Sora却依旧受限于1080p的型正最大分辨率。

谷歌在关于Veo 2的面迎介绍中提到:“低分辨率视频非常适合移动设备,但创作者希望看到他们的谷歌作品在大屏幕上大放异彩。”显然,推出这段发言直指Sora。频模
谷歌发言人表示,型正Veo 2 的面迎佛山新闻网报料热线4K剪辑默认限制为8秒,但可以延长至2分钟或更长时间。与之相比,Sora的1080p视频上限仅为20秒。

抛开以上这些参数,AI视频模型有个问题绕不过,就是那些“低级”BUG。Sora一经推出,很多自媒体都做了测试,坏消息是,各种奇怪的物理和人体表现依旧存在。比如,生成人物可能有许多条腿,或遇到稍微复杂的运动时,扭曲的身体让人看得背后发毛,似乎这是AI现阶段难以逾越的大山。
但谷歌部门声称,在纠正“幻觉”细节(如额外的手指)和展示“现实世界的物理学以及人类运动和表情”方面取得了重大进展。

一些具备相关学术背景的专业人士对AI所犯的物理错误发表了看法,他们认为,只能通过所谓的世界模型来解决,这些模型具有理解和生成3D环境的“空间智能”。凑巧的是,谷歌本月早些时候推出了自己的Genie 2世界模型,难道这就是《黑客帝国》的训练场?
同时,Veo 2也能更好理解“电影语言”,比如“18mm镜头”、“浅景深”等专业用语。但是,也有很多人对日趋“合理”的视频模型产生担忧,图像和视频生成器的输出越合理,它们被用于邪恶目的的风险就越大,防伪技术的迭代势在必行。

对于Veo 2来说,DeepMind将不可见的SynthID水印置于Veo 2生成的视频中。这种“水印”的优点是,隐匿的SynthID可能会让视频传播者大意,技术人员更容易发现造假视频的证据。缺点也很明显,普通人很难区分一段视频是否由AI生成。
相比之下,OpenAI的Sora会在其生成视频的右下角嵌入一个可见的水印动画,对于普通人更容易分辨。

不过大家对于AI视频模型的担忧一定不会停止,现阶段,各家视频大模型还是以秒或分钟来生成,而且相对比较容易分辨。但按照当今的发展速度,未来AI生成的视频一定会以假乱真,到时候我们将如何面对互联网世界?你所喜爱的视频博主,也许根本不存在。
相关阅读
- 我省各地传统村落向全国展现徽风皖韵魅力
- 海洋油气装备再获突破
- 钟祥市应急管理局:跑出一线“加速度” 当好安全“守夜人”
- 李埠长江公铁大桥南北两岸主塔“牵手”进入关键期
- 灵魂词作家许鹏原创歌曲《毒打》:诗与歌的极致缠缚,让每一寸欲望之火彻底湮灭
- 男子腹痛两天险成大祸 多镜联合手术紧急救治成功
- 当心学费生活费被骗!武汉公安发布近期诈骗案例
- 高铁穿花田 轨道上的湖北美不胜收
- 全国率先!全省统一上线医保基金即时结算
- 嘉鱼县:法治阳光照进校园,趣味接力守护成长
- 湖北钟祥:禁毒宣传走进植树节
- 中山舰博物馆“藏”着一片油菜花海
- 陈楚生2026「荒芜之境」上海站圆满落幕 全域升级铸就视听新标杆
- 孝南:盘活“老家底” 打造“新地标”
- 莎拉波娃状态不稳 输给老冤家加西亚
- 全球增绿看中国!2025年国土绿化公报亮出硬核数据
- 中国科大科技商学院正式开建
- 春生万物 “植”此青绿
- 应城田店镇用“智”绘春耕新篇章
- 打好“预防针”敲响“警示钟” ——应城市审计局召开外出审计组出征前廉政谈话会