OpenAI推新工具Sora 一句話生成60秒短片

香港文匯報國際 2024-02-17

　　靜態圖像變動態天馬行空可成真

　　香港文匯報訊體型龐大的猛獁象在雪地中前行；年輕男子坐在雲上閱讀；迷你小浣熊在顯微鏡下的竹林嬉戲……種種精緻逼真的畫面如今只需一句話，便會呈現在人們眼前。美國科企OpenAI周四（2月15日）宣布推出新模型「Sora」，利用人工智能（AI）技術，輸入簡單的文字指示，即可生成高質素的影片。影片生成技術的迅速發展，亦將為AI在更多領域的深入應用打開大門。

　　Sora取自日語「天空」一詞，模型每次可生成長約一分鐘的影片，符合用戶想要的主題、角色設計、背景畫面和風格等。該模型還能依照靜態圖像生成動態畫面，或允許用戶加入新材料擴展已有片段。OpenAI行政總裁阿爾特曼周四在社媒X上，鼓勵用戶將自己想到的文字描述提交給Sora，「不用擔心你的要求太詳盡，或是難度太高。」

　　網民們的奇思妙想，很快可化作妙趣橫生的影片。有人提出用無人機視角拍攝「一場動物海上單車競賽」，阿爾特曼便展示一段Sora生成的影片，畫面中的企鵝、海豚和各類水生動物全數化身「選手」，騎單車你追我趕。另有人想要看一段「電影質感片段」，描繪一名「網紅嫲嫲在托斯卡納鄉郊廚房」。很快一名身穿圍裙、面帶微笑的銀髮女士便出現在鏡頭前，邀請觀眾參加她的烹飪課。

　　技術仍存左右不分等問題

　　OpenAI承認，Sora的新技術仍存在左右不分等問題。亦有影視專家指出，在Sora一段呈現東京街頭的影片中，畫面主角女子的左右腿似乎交換了位置，背景畫面中也有人被汽車等移動的物體短暫遮擋後，便無故在畫面中消失。

　　不過影視專家普遍認為，在Sora之前的AI影片生成工具往往只能製作幾秒鏡頭，且內容與文字經常無關。Sora的畫面逼真程度，以及影片內容與文字要求的契合度，已經超出其他工具。OpenAI未有透露訓練Sora使用了多少畫面，也沒有透露作為訓練資料的影片來源，僅表示這些資料包含已經公開、或是獲得版權許可的片段。

　　禁作美大選政治造勢用途

　　OpenAI暫時不對普通用戶開放Sora，僅允許研究人員、指定的視覺藝術家和電影製片人有限使用。研發團隊還會測試Sora的影片，會否產生違反OpenAI服務條款的暴力或侵權內容。公司已表示今年美國總統大選期間，會禁止將其工具用作政治造勢用途。

讀香港文匯報PDF版面