00:00
尊敬的用户您好,这是来自FT中文网的温馨提示:如您对更多FT中文网的内容感兴趣,请在苹果应用商店或谷歌应用市场搜索“FT中文网”,下载FT中文网的官方应用。
{"text":[[{"start":9.88,"text":"在视频生成这一生成式AI关键战场上,中国人工智能企业已经领先美国竞争对手;视频生成正被广告、电商和娱乐等行业迅速采用。"}],[{"start":21.28,"text":"总部位于北京的字节跳动和快手等公司,正利用海量短视频素材训练系统,因此在这方面领先于美国竞争对手。"}],[{"start":30.71,"text":"据开发者和多个使用排行榜显示,这一转变标志着AI竞赛出现分化:尽管OpenAI、谷歌(Google)和Anthropic仍然主导大型语言模型以及编程等领域,但它们的视频工具在质量和易用性方面都落后于中国的产品。"}],[{"start":null,"text":"
"}],[{"start":null,"text":"一部由创作者使用Seedance 2.0制作并发布到网上的短片
"}],[{"start":46.89,"text":"训练视频模型需要海量高质量的影像素材,而在这一点上,中国平台因拥有TikTok等短视频应用及其所产生的数据而占据优势。一些专家指出,中国企业在获取受版权保护内容方面也更为激进。"}],[{"start":62.64,"text":"“我们试过的大多数美国模型在视频生成方面都不太理想,”Director AI的创始人Ben Chiang说道,这是一家制作卡通片、短剧等AI生成内容的初创公司。他表示,更为严格的内容管控限制了美国的工具,往往导致生成结果不够逼真。"}],[{"start":81.47,"text":"Director AI主要使用快手开发的可灵AI(Kling),并会根据任务和成本在字节跳动的Seedance 2.0和初创公司稀宇科技(MiniMax)的海螺AI(Hailuo)之间切换。"}],[{"start":92.03,"text":"Ben Chiang说:“归根结底取决于质量,以及模型对提示的执行程度。”他补充说,最近的进展让这些工具在使用上更加顺畅,尤其体现在音频同步和语音稳定方面。"}],[{"start":105.81,"text":"对于创作者而言,这些改进已经在重塑制作流程。“Seedance 2.0极大解放了我的创作自由,”身在格鲁吉亚首都第比利斯的独立AI电影制作人兼剪辑师George Won说。"}],[{"start":119.43,"text":"“它能处理大幅度的镜头角度变化和高速运动,而不会让角色的脸或光影对比失真。大多数AI模型在画面快速运动时会开始抖动或漂移。”他补充道。"}],[{"start":null,"text":"
"}],[{"start":132.64000000000001,"text":"可灵AI(Kling)、Seedance 2.0和HappyHorse 1.0在Arena评选的最佳视频模型排行榜中得分都很高,该榜单由独立平台上的用户投票汇总而成。此类评估被认为比大多数模型基准测试系统更可靠,后者往往被AI实验室针对性优化,未必能准确反映模型在现实世界中的表现。"}],[{"start":154.4,"text":"专家表示,谷歌的Veo 3模型同样具备竞争力,凭借可访问YouTube视频素材而占有优势,但对开发者可生成的内容设置了更多安全防护和限制。"}],[{"start":165.94,"text":"这一进展得益于对海量专有视频数据的获取。字节跳动和快手运营着全球规模最大的一些短视频平台,使它们在模型训练上拥有难以被竞争对手复制的优势——尤其是因为与文本不同,视频内容很难被大规模抓取。"}],[{"start":183.25,"text":"本周,快手宣布正在探索将可灵AI(Kling)业务剥离的方案,并有可能推动其单独上市,以抓住其快速增长的AI视频业务带来的机遇。"}],[{"start":193.44,"text":"此类素材的使用也引发了外界审视。字节跳动因被指允许用户在未获得适当授权的情况下,使用包括漫威电影和电视系列《南方公园》中的角色创作视频,而面临法律威胁。这家中国互联网集团已承诺加强保护措施。"}],[{"start":211.14,"text":"多位开发者和创作者表示,更宽松的内容限制让中国的模型在实际使用中更方便。Ben Chiang说,美国的工具会“不断出现错误”,以违反使用条款为由拒绝请求,却不给出进一步解释。"}],[{"start":225.52999999999997,"text":"对个人创作者而言,中国平台往往比西方同类产品更便宜、更灵活,提供订阅制或按量付费等模式,从而支持快速试验。不过,自今年2月以来,Seedance 2.0的高需求已经导致部分用户的使用受限、排队时间过长。"}],[{"start":243.64,"text":"对于企业客户,字节跳动采取了不同的做法。据知情人士透露,对于部分美国客户,公司要求对方先作出大额预付承诺,要求客户支付约200万美元以获得访问权限和使用额度。字节跳动未就置评请求作出回应。"}],[{"start":261.57,"text":"有些用户通过第三方平台(例如BeHooked)来访问这些模型,从而绕过这些限制;这些平台会对模型重新包装,并采用不同的定价结构。"}],[{"start":null,"text":"
"}],[{"start":null,"text":"Udin AI视频是热门的Italian Brainrot风潮,特点是充满混乱的AI生成场景
"}],[{"start":271.92,"text":"生成视频所需的token远多于文本或音频——token是AI模型处理的数据单位——这使得大规模部署成本高昂。今年3月,OpenAI停止提供其Sora视频生成模型,部分原因是计算成本过高。"}],[{"start":287.36,"text":"对于基于这项技术开发产品的公司来说,最近的质量飞跃正在带来商业机遇。"}],[{"start":293.65000000000003,"text":"“之前,这些视频既尴尬又机械,达不到品牌标准。”为电商网站提供视频基础设施的Firework公司首席执行官Vincent Yang说道。“现在我们已经到了一个分不清是AI生成还是人类制作的阶段。”"}],[{"start":310.09000000000003,"text":"Vincent Yang表示,这项技术已经在重塑广告行业,使品牌能够以过去无法实现的规模生成视频。"}],[{"start":317.89000000000004,"text":"“有一家零售商要求我们为其产品页面制作10万段视频,”他说,“如果没有AI,这在成本上将是难以承受的。现在,每件产品都可以拥有自己的视频,甚至还能针对不同客户制作多个版本。”"}],[{"start":333.74000000000007,"text":"克里斯蒂娜•克里德尔(Cristina Criddle)在旧金山补充报道"}]],"url":"https://audio.ftcn.net.cn/album/a_1778999126_4068.mp3"}