OpenAI推新工具Sora 一句話生成60秒短片
靜態圖像變動態 天馬行空可成真
香港文匯報訊 體型龐大的猛獁象在雪地中前行;年輕男子坐在雲上閱讀;迷你小浣熊在顯微鏡下的竹林嬉戲……種種精緻逼真的畫面如今只需一句話,便會呈現在人們眼前。美國科企OpenAI周四(2月15日)宣布推出新模型「Sora」,利用人工智能(AI)技術,輸入簡單的文字指示,即可生成高質素的影片。影片生成技術的迅速發展,亦將為AI在更多領域的深入應用打開大門。
Sora取自日語「天空」一詞,模型每次可生成長約一分鐘的影片,符合用戶想要的主題、角色設計、背景畫面和風格等。該模型還能依照靜態圖像生成動態畫面,或允許用戶加入新材料擴展已有片段。OpenAI行政總裁阿爾特曼周四在社媒X上,鼓勵用戶將自己想到的文字描述提交給Sora,「不用擔心你的要求太詳盡,或是難度太高。」
網民們的奇思妙想,很快可化作妙趣橫生的影片。有人提出用無人機視角拍攝「一場動物海上單車競賽」,阿爾特曼便展示一段Sora生成的影片,畫面中的企鵝、海豚和各類水生動物全數化身「選手」,騎單車你追我趕。另有人想要看一段「電影質感片段」,描繪一名「網紅嫲嫲在托斯卡納鄉郊廚房」。很快一名身穿圍裙、面帶微笑的銀髮女士便出現在鏡頭前,邀請觀眾參加她的烹飪課。
技術仍存左右不分等問題
OpenAI承認,Sora的新技術仍存在左右不分等問題。亦有影視專家指出,在Sora一段呈現東京街頭的影片中,畫面主角女子的左右腿似乎交換了位置,背景畫面中也有人被汽車等移動的物體短暫遮擋後,便無故在畫面中消失。
不過影視專家普遍認為,在Sora之前的AI影片生成工具往往只能製作幾秒鏡頭,且內容與文字經常無關。Sora的畫面逼真程度,以及影片內容與文字要求的契合度,已經超出其他工具。OpenAI未有透露訓練Sora使用了多少畫面,也沒有透露作為訓練資料的影片來源,僅表示這些資料包含已經公開、或是獲得版權許可的片段。
禁作美大選政治造勢用途
OpenAI暫時不對普通用戶開放Sora,僅允許研究人員、指定的視覺藝術家和電影製片人有限使用。研發團隊還會測試Sora的影片,會否產生違反OpenAI服務條款的暴力或侵權內容。公司已表示今年美國總統大選期間,會禁止將其工具用作政治造勢用途。