“车展实拍”视频走红,场景、人物、对话声音全由谷歌 Veo 模型生成
作者:五福软件园时间:2025-05-24 11:49:04
本站 5 月 23 日消息,几十年来,大型车展对汽车厂商、中外记者,以及所有热爱马力、机械和时尚的人而言,都是不可错过的年度大事。但近年在海外,情况大变 —— 多家车展人流锐减、展会纷纷停办,公众兴趣明显降温。
据外媒 Carscoops 今日报道,与此同时,一段近期在网上热传的视频却显示,“某处”正在举行一场盛大的车展,观众热情高涨。但问题是,这场车展根本不存在。
视频开头就已点明真相:“欢迎来到一个不存在的车展。”一名“主持人”出场如是说。“我们来听听大家的看法。”随后是一分多钟的“采访”片段,镜头中“观众”畅谈展会体验与展车感想。
有人兴奋不已,有人担忧安全,还有人只是单纯享受参展的喜悦。但所有人、所有声音乃至画面中的车与背景,其实全是 AI 生成。发布这段视频的是名为 László Gaál 的创作者,他在 X 平台上传了这段视频并表示:“在你开口之前我就先说了:这一切都是 AI。”
他补充道,每一段视频都是通过“单一的提示词(single text prompts)”生成,随后再剪辑整合。具体来看,他使用了谷歌 Veo3 完成制作。
当然,视频也非毫无破绽。例如夹克上的字母常常拼错,AI 最难处理的“手”也仍有缺陷。有段镜头中,一位男子的手几乎是反向的,另一处画面则出现手穿过衣袋的情形。尽管如此,整体完成度依旧令人赞叹,就连背景的汽车也足以以假乱真。
据本站此前报道,在今年的 I/O 开发者大会上,谷歌发布新一代视频生成模型 Veo3,这也是其首个可生成视频背景音效的模型。它不仅能合成画面,还能为鸟鸣或街头交通等场景配上相应的音效,甚至还可生成人物对话。
相关阅读:
《谷歌最强视频生成 AI 模型 Veo3 亮相:制作背景音、人物对话都不在话下》
相关文章
-
“车展实拍”视频走红,场景、人物、对话声音全由谷歌 Veo 模型生成
本站 5 月 23 日消息,几十年来,大型车展对汽车厂商、中外记者,以及所有热爱马力、机械和时尚的人而言,都是不可错过的年度大事。但近年在海外,情况大变 —— 多家车展人流锐减、展会纷纷停办,公众兴趣
-
宏碁推出全新 Swift Edge、Go 和 X 系列笔记本,CPU 全面升级
本站 5 月 17 日消息,据外媒 Engadget 今日报道,宏碁在今年的台北电脑展将推出全新 Swift Edge、Go 和 X 系列笔记本,全面升级为最新英特尔处理器,其中一款产品更首次采用康宁
-
雷克沙 ARES PRO PCIe 5.0 SSD 开启预售,1TB 首发价 679 元
本站 5 月 23 日消息,雷克沙 ARES PRO PCIe 5 0 固态硬盘在京东开启预售,官方称读取速度达 14000MB s,本站附各容量价格:1TB 预售价 679 元,定金 20 元2TB
-
小米 15 周年产品答网友问:15S Pro 相比 15 Pro 影像、屏幕、散热系统等均有升级
感谢本站网友 Anon_Tokyo 的线索投递! 本站 5 月 23 日消息,小米手机官微今晚发布“小米 15 周年产品答网友问”,主要包括“小米 15S
-
摩托罗拉 Moto G56 手机完整规格曝光:天玑 7060 芯片,8GB+256GB 版售 270 欧元
本站 5 月 24 日消息,科技媒体 ytechb 昨日(5 月 23 日)发布博文,报道称摩托罗拉即将发布中端智能手机 Moto G56,8GB+256GB 版本售价为 270 欧元(本站注:现汇率
-
微软推出 NLWeb 开源项目,让网站“一键变身”AI 应用
本站 5 月 20 日消息,在目前正在进行的微软Build 2025中,微软正式发布了一个名为“NLWeb”的开源项目,旨在帮助开发者轻松将网站转化为支持自然语言交互的 AI 应用,可提供“类似 Ch