OpenAI推新东西 文字可转60秒视频

发布时间:2024-04-13 02:09:57来源:nba小九直播浏览次数:1作者:nba小九直播高清

  上图:OpenAI推出AI视频生成东西Sora,图为其生成视频“女子在东京街头行走”截图。\网络图片;下图:Sora生成视频“含有中国龙的新年庆典”截图。\网络图片

  【大公报讯】归纳法新社、《华尔街日报》、《麻省理工科技谈论》报导:继推出抢手谈天机器人ChatGPT之后,人工智能(AI)公司OpenAI在15日又有大动作,宣告推出全新的视频AI生成东西“Sora”。该东西可以根据文字输入,生成最长60秒的高品质视频,极具“爆款”潜质。Sora现在仍存在许多缺点,包含无法处理比较杂乱的体裁,发生“左右不分”等等。由于生成视频的才能过分强壮,该东西现在仍在测验阶段,在OpenAI完结危险评价前,暂时不会对大众敞开。

  “在夜晚的城市中,霓虹灯火将大街点亮,身着皮衣的女子从行人中走出,墨镜上反射出大街上的斑马线”……乍一看,这段长达59秒的视频似乎是实在拍照的,可是它其实是由OpenAI全新AI视频生成东西Sora凭仗寥寥数行输入的文字,一键输入、随便生成的视频。

  美国当地时间15日下午,OpenAI正式揭露宣告推出视频生成东西Sora,并发布了一系列该东西生成的演示视频。这些视频形形色色,体裁包含猛犸象踏过雪原,淘金热时期的美国小镇、男人坐在白云上读书等等,画面生动传神,令人张口结舌。

  AI视频东西已成为业界的抢手话题。Sora十分易用,用户只需输入文字描述自己想要的视频,AI就能输出一段最长60秒、细节丰厚的影片,毋须具有任何视频拍照的设备与制造经历,比较于传统的视频制造,AI功率更加高、本钱更低,大幅度下降视频门槛,几可完成“人人都可以当导演”。

  Sora运用的技能,与OpenAI旗下的图画生成AI东西DALL-E类似,运用“分散模型”来练习AI将随机像素转变成视频。可是练习AI处理视频与以往的处理文字不同,由于视频并非由文字组成。研讨人员要想方法,将视频切成像文字单词相同的“块”。终究,他们将视频按帧数区分,在空间和时间上也切割成“块”。如此一来,Sora内部的神经网络就能像处理言语文本相同,可处理视频“块”。

  OpenAI科学家布鲁克斯表明,树立可以了解视频,以及人们国际中杂乱互动的模型,是一切未来AI体系的重要一步。其他科企,如Meta、谷歌在研讨文字到视频的AI技能。

  虽然OpenAI的演示视频令人形象十分深入,但在交际平台上,不少受邀测验的创作者宣布的视频,显现了Sora问题不少,尤其是处理相对杂乱体裁。例如,在一个“男人在跑步”的视频中,男人站在跑步机上,但却在朝着与跑步机相反的方向跑动。在另一“穿帮”视频中,一群小狼在小路上嬉戏的视频中,发生了数次小狼“随便出现”或“随便消失”的景象。

  OpenAI正告称,Sora当时的模型“存在缺点”,例如在生成视频期间对空间认知发生过错、发生“左右不分”,或无法在整个视频中坚持视觉连续性等。OpenAI解说说,例如,视频中一个人咬了一口饼干,但之后这块饼干上的咬痕或许就会消失。《》记者Drew Harwell指出,Sora所生成的视频中,人类手部形状有缺点,易穿帮,这是AI生成图画中最难以霸占的妨碍之一。

  Sora才能让人惊奇的一同,也引发了外界AI技能乱用的忧虑。OpenAI表明,已认识到了Sora或许会生成过错信息和仇视内容等。Sora现在仅敞开给少数学者与研讨人员运用,其间将一同进行所谓的红队演练(red-teaming),即企图让AI东西“失灵”,发生不恰当的内容或出毛病,以发觉缺点。OpenAI在有定论之前,不会敞开大众运用Sora。

上一篇:电影《爆炸班》官宣发动准备五年以全新视角展示英豪史诗 下一篇:腾讯音乐财报之下:爆款频出音乐内容宣发第一阵地的再进化