生成文本、圖像、音頻、視頻……
2024年生成式人工智能進(jìn)化成什么樣了?
自從人工智能技術(shù)開始涉足內(nèi)容生產(chǎn)領(lǐng)域,通過算法和模型來生成文本、圖像、音頻等內(nèi)容后,2024年王炸產(chǎn)品Sora的問世再度席卷視頻領(lǐng)域。
游戲中出現(xiàn)可互動的智能NPC(游戲中非玩家操控的游戲角色)、輸入文本可一鍵生成包括配音、字母的一段短視頻……得益于硬件算力的提升,AIGC(生成式人工智能)的核心算法和大模型訓(xùn)練水平也在不斷提高,能夠更好地落地至應(yīng)用或場景中。
盡管AIGC在互動行業(yè)的應(yīng)用已經(jīng)取得了巨大成功,但仍然存在一些挑戰(zhàn)和問題,法律風(fēng)險和版權(quán)爭議仍然是需要不斷調(diào)整和完善的問題。
想象力轉(zhuǎn)化為動態(tài)畫面 AI開啟全新視覺敘事時代
上個世紀(jì)50年代,AI(人工智能)出現(xiàn),隨著計算機(jī)技術(shù)的不斷進(jìn)步和軟件算法的不斷優(yōu)化,人工智能技術(shù)逐漸成為了當(dāng)今科技領(lǐng)域的熱門話題和應(yīng)用領(lǐng)域;ヂ(lián)網(wǎng)的內(nèi)容生產(chǎn)模式也逐漸經(jīng)歷了三個發(fā)展階段:PGC(專家生產(chǎn)內(nèi)容)、UGC(用戶生產(chǎn)內(nèi)容)和AIGC(AI生產(chǎn)內(nèi)容)。
到了2023年,以AIGC為代表的一系列技術(shù)創(chuàng)新再次燃起技術(shù)革命產(chǎn)業(yè)賦能和科技創(chuàng)新創(chuàng)業(yè)的熱情,人們見證了文生文、文生圖的進(jìn)展速度。AIGC相關(guān)應(yīng)用以驚人的速度滲透到各個國家,各個行業(yè),各種場景和領(lǐng)域,新技術(shù)的有效性已經(jīng)在多個領(lǐng)域被驗(yàn)證和確認(rèn),人們有機(jī)會以全新的生產(chǎn)方式和生產(chǎn)關(guān)系完成現(xiàn)有的工作和任務(wù)。
2024年開年,OpenAI發(fā)布了王炸文生視頻大模型Sora,它僅僅根據(jù)提示詞,就能夠生成60s的連貫視頻,“碾壓”了行業(yè)目前大概只有平均“4s”的視頻生成長度。
可以說,Sora的出現(xiàn),預(yù)示著一個全新的視覺敘事時代的到來,它能夠?qū)⑷藗兊南胂罅D(zhuǎn)化為生動的動態(tài)畫面,將文字的魔力轉(zhuǎn)化為視覺的盛宴。在這個由數(shù)據(jù)和算法編織的未來,以Sora為代表的AIGC,正以其獨(dú)特的方式,重新定義著人們與數(shù)字世界的互動。
滲透醫(yī)療金融駕駛多領(lǐng)域 AI或?qū)⒊蔀榛A(chǔ)設(shè)施
AIGC交互界面的用戶友好性、大模型開源及API(應(yīng)用程序編程接口)價格的降低、插件服務(wù)帶來的應(yīng)用生態(tài)繁榮等,都使得AI技術(shù)或?qū)⒊蔀橄袼、電、網(wǎng)絡(luò)一樣的基礎(chǔ)設(shè)施,滲透并改變千行萬業(yè)。根據(jù)愛設(shè)計等多平臺聯(lián)合發(fā)布的《2024年AIGC發(fā)展趨勢報告》,在醫(yī)療領(lǐng)域,AI的應(yīng)用已能夠精準(zhǔn)輔助診斷,例如Google Health的深度學(xué)習(xí)模型,在乳腺癌篩查中的準(zhǔn)確率已超越人類專家。利用強(qiáng)大的圖像識別和模式分析能力,這些模型可以從成千上萬的X光片中識別出極易被人眼忽視的細(xì)微變化。
金融領(lǐng)域也經(jīng)歷了由AI推動的變革。金融機(jī)構(gòu)利用復(fù)雜的算法來預(yù)測市場趨勢、管理風(fēng)險,甚至自動執(zhí)行交易。機(jī)器學(xué)習(xí)技術(shù)能夠分析大規(guī)模的歷史數(shù)據(jù),識別出人類難以察覺的模式。例如,通過深度學(xué)習(xí),AI可以在高頻交易中捕捉到微小的市場變化,并在毫秒級做出反應(yīng),這是任何人類交易者所無法比擬的。
自動駕駛領(lǐng)域的AI應(yīng)用,展示了AI能夠在高度復(fù)雜和動態(tài)的環(huán)境中執(zhí)行任務(wù)的能力。特斯拉的Autopilot、谷歌的Waymo,這些自動駕駛系統(tǒng)使用了先進(jìn)的傳感器陣列和AI算法,實(shí)現(xiàn)了車輛的自主導(dǎo)航和決策。它們的表現(xiàn)日益接近人類駕駛者,甚至在某些情境下超越了人類。
在娛樂和創(chuàng)意產(chǎn)業(yè)中,AI也為人類的創(chuàng)造力打開了新的維度。OpenAI的DALL·E能夠根據(jù)簡短的文本描述生成驚人的圖像作品,AI音樂程序能夠創(chuàng)作出動聽的旋律。這些AI工具不僅激發(fā)了創(chuàng)作者的靈感,也改變了藝術(shù)創(chuàng)作的方式。AI的這一創(chuàng)造性成果是前所未有的,它為人類文化的多樣性貢獻(xiàn)了新的元素。
AI“擅長”生產(chǎn)虛擬內(nèi)容 互動娛樂行業(yè)出現(xiàn)重大變革
以生產(chǎn)虛擬內(nèi)容為主的互動娛樂行業(yè)受到了來自AIGC的強(qiáng)大影響。點(diǎn)點(diǎn)數(shù)據(jù)一份關(guān)于AIGC對互動娛樂行業(yè)影響趨勢的洞察報告認(rèn)為,以游戲、視頻、網(wǎng)文、音頻等為主的互動娛樂行業(yè),不僅在內(nèi)容的生產(chǎn)方式上受AIGC影響產(chǎn)生了結(jié)構(gòu)性的變化,并且內(nèi)容本身的呈現(xiàn)形式也將出現(xiàn)巨大變革。
該報告列舉的案例中,國內(nèi)一款結(jié)合AIGC功能打造的手機(jī)游戲《逆水寒》中首次出現(xiàn)了“智能NPC”。NPC之間會自主地產(chǎn)生交互,且不僅僅是只限于文本內(nèi)容的聊天,而是包含移動、送禮、交易,甚至決斗等行為,并且過程中玩家也可以隨時加入互動,從而影響NPC的行為。更讓玩家意外的是,NPC是具備“記憶”的。如果你對NPC示好,在下一次碰見時,他可能會主動叫住你,和你說一些悄悄話,或就之前的事情再次與你相聊甚歡;而如果玩家與NPC交惡,那NPC也會拒絕和玩家多聊天,甚至一言不合還會兵刃相見。
而游戲中除了智能NPC以外,NPC語音生成、NPC說話口型、玩家創(chuàng)建角色一鍵捏臉(輸入文本即可生成臉型)等系統(tǒng),也都深度結(jié)合了AIGC功能,并為游戲貢獻(xiàn)了非常高的玩家粘性和話題熱度。
另外一款國產(chǎn)熱門游戲《蛋仔派對》,在2023年6月周年慶版本的更新中,新增了創(chuàng)意工坊“生成器”功能,提供了圖片墻(上傳的圖片自動生成像素圖)、像素文字(輸入文字生成像素圖)、花朵(輸入?yún)?shù)批量生成花朵)三類生成功能。而隨著后續(xù)的版本更新,生成器的功能也在不斷增加和完善,特別是去年12月更新的“萬能生成器”,更是再次突破了UGC創(chuàng)作上限。玩家只需輸入提示詞,就能在游戲內(nèi)直接生成對應(yīng)的物品,并布置到場景之中。
被短視頻制作者熟知的“剪映”App,已可以提供從文案編輯、一鍵成文、視頻生成、AI作圖到最終剪輯成片的一站式服務(wù),包括:基于用戶輸入的主題和內(nèi)容要點(diǎn)生成文案;根據(jù)文案內(nèi)容一鍵生成視頻并包含配音字幕等基礎(chǔ)視頻內(nèi)容;用戶輸入提示詞即可生成視頻內(nèi)需要的畫面和動圖;內(nèi)置AI寫真、AI特效、AI作圖等功能方便用戶自制素材;人聲美化功能幫助用戶生成個人的音頻數(shù)字分身等等。這些功能都深度結(jié)合了AIGC,即提高了創(chuàng)作效率,也下放了創(chuàng)作門檻。從實(shí)際效果來看,雖然單個功能的效果可能目前很難以與ChatGPT、Midjourney、Stable Diffusion等專業(yè)的圖文生成軟件相媲美,但其提供的資源整合性、使用便利性以及生成素材直接用于視頻剪輯的一致性,讓用戶在使用過程中的實(shí)際體驗(yàn)流暢且高效。
AI發(fā)展應(yīng)尊重人類價值 法律法規(guī)不斷完整完善
需要警醒的是,AI在特定領(lǐng)域中的成功,也揭示了其所面臨的限制。隨著AI從實(shí)驗(yàn)室研究走向現(xiàn)實(shí)場景這一過程的推進(jìn),技術(shù)、法規(guī)、倫理以及社會接受度的挑戰(zhàn)逐漸浮現(xiàn)。要充分發(fā)揮AI的潛能,需要在這些方面尋找平衡,以確保AI技術(shù)能夠在尊重人類價值的同時,推動社會進(jìn)步。
隨著越來越多的內(nèi)容由AIGC生成,內(nèi)容的準(zhǔn)確性和可信度也就成為接下來的關(guān)鍵問題?梢灶A(yù)見,在未來,AIGC將會引入更多的算法和機(jī)制,以應(yīng)對虛假信息、抄襲和其他違規(guī)行為的挑戰(zhàn),確保生成內(nèi)容的真實(shí)性、合法性。
企業(yè)層面,例如游戲和軟件平臺Steam在2024年1月10日發(fā)布最新公告,對“AIGC+游戲”的態(tài)度做了大幅調(diào)整。將涉及AIGC的游戲分為了“預(yù)生成內(nèi)容”和“實(shí)時生成內(nèi)容”兩個大類,無論哪一類開發(fā)者都需要提交相關(guān)內(nèi)容來闡述AIGC在游戲開發(fā)和運(yùn)行過程中是如何被運(yùn)用的,并且這些信息也會披露給玩家。與此同時,玩家也可以在游戲中隨時就AIGC相關(guān)內(nèi)容進(jìn)行舉報。這是首次由頭部游戲平臺公開發(fā)表并明確對涉及AIGC相關(guān)產(chǎn)品的態(tài)度。
除了類似Steam這樣的平臺在不斷調(diào)整策略外,全球各國在法律層面也在不斷完善相關(guān)法律法規(guī)。就互娛產(chǎn)品中最常見的圖片內(nèi)容來看,韓國發(fā)布的《生成式AI著作權(quán)指南》,明確AIGC內(nèi)容不受版權(quán)保護(hù);而美國政府則認(rèn)為由AIGC直接生成的作品不受法律保護(hù),但通過與AIGC合作、并體現(xiàn)了人類創(chuàng)意成果的作品,是可以獲得版權(quán)保護(hù)的。
在我國,2023年7月13日,國家網(wǎng)信辦等七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》,旨在促進(jìn)生成式人工智能的健康發(fā)展和規(guī)范應(yīng)用,維護(hù)國家安全和社會公共利益,保護(hù)公民、法人和其他組織的合法權(quán)益。北京、上海等地也相繼出臺相關(guān)規(guī)范和條例。
目前,關(guān)于AI的合規(guī)問題主要涉及數(shù)據(jù)、AI產(chǎn)品、個人服務(wù)和行業(yè)應(yīng)用。國際數(shù)據(jù)公司IDC指出,在法律法規(guī)的框架下,所有大模型和AI生態(tài)廠商都必須認(rèn)真對待新一代人工智能產(chǎn)業(yè)中的合法合規(guī)問題,特別是通過算法模型的優(yōu)化,增強(qiáng)人工智能的可解釋性。
分享讓更多人看到