首頁
黨政
- 黨網(wǎng) · 時政
- 人事
- 反腐
- 理論
- 黨史
- 黨建
要聞
觀點(diǎn)
互動
可視化
地方
- 京
- 津
- 冀
- 晉
- 蒙
- 遼
- 吉
- 黑
- 滬
- 蘇
- 浙
- 皖
- 閩
- 贛
- 魯
- 豫
- 鄂
- 湘
- 粵
- 桂
- 瓊
- 渝
- 川
- 黔
- 滇
- 藏
- 陜
- 甘
- 青
- 寧
- 新
- 鵬
- 雄安
民文
English
合作網(wǎng)站
舉報專區(qū)
登錄

退出

生成文本、圖像、音頻、視頻……

2024年生成式人工智能進(jìn)化成什么樣了？

記者陳斯

2024年04月15日07:42 | 來源：北京青年報

小字號

自從人工智能技術(shù)開始涉足內(nèi)容生產(chǎn)領(lǐng)域，通過算法和模型來生成文本、圖像、音頻等內(nèi)容后，2024年王炸產(chǎn)品Sora的問世再度席卷視頻領(lǐng)域。

游戲中出現(xiàn)可互動的智能NPC（游戲中非玩家操控的游戲角色）、輸入文本可一鍵生成包括配音、字母的一段短視頻……得益于硬件算力的提升，AIGC（生成式人工智能）的核心算法和大模型訓(xùn)練水平也在不斷提高，能夠更好地落地至應(yīng)用或場景中。

盡管AIGC在互動行業(yè)的應(yīng)用已經(jīng)取得了巨大成功，但仍然存在一些挑戰(zhàn)和問題，法律風(fēng)險和版權(quán)爭議仍然是需要不斷調(diào)整和完善的問題。

想象力轉(zhuǎn)化為動態(tài)畫面 AI開啟全新視覺敘事時代

上個世紀(jì)50年代，AI（人工智能）出現(xiàn)，隨著計算機(jī)技術(shù)的不斷進(jìn)步和軟件算法的不斷優(yōu)化，人工智能技術(shù)逐漸成為了當(dāng)今科技領(lǐng)域的熱門話題和應(yīng)用領(lǐng)域�；ヂ�(lián)網(wǎng)的內(nèi)容生產(chǎn)模式也逐漸經(jīng)歷了三個發(fā)展階段：PGC（專家生產(chǎn)內(nèi)容）、UGC（用戶生產(chǎn)內(nèi)容）和AIGC（AI生產(chǎn)內(nèi)容）。

到了2023年，以AIGC為代表的一系列技術(shù)創(chuàng)新再次燃起技術(shù)革命產(chǎn)業(yè)賦能和科技創(chuàng)新創(chuàng)業(yè)的熱情，人們見證了文生文、文生圖的進(jìn)展速度。AIGC相關(guān)應(yīng)用以驚人的速度滲透到各個國家，各個行業(yè)，各種場景和領(lǐng)域，新技術(shù)的有效性已經(jīng)在多個領(lǐng)域被驗(yàn)證和確認(rèn)，人們有機(jī)會以全新的生產(chǎn)方式和生產(chǎn)關(guān)系完成現(xiàn)有的工作和任務(wù)。

2024年開年，OpenAI發(fā)布了王炸文生視頻大模型Sora，它僅僅根據(jù)提示詞，就能夠生成60s的連貫視頻，“碾壓”了行業(yè)目前大概只有平均“4s”的視頻生成長度。

可以說，Sora的出現(xiàn)，預(yù)示著一個全新的視覺敘事時代的到來，它能夠?qū)⑷藗兊南胂罅︕D(zhuǎn)化為生動的動態(tài)畫面，將文字的魔力轉(zhuǎn)化為視覺的盛宴。在這個由數(shù)據(jù)和算法編織的未來，以Sora為代表的AIGC，正以其獨(dú)特的方式，重新定義著人們與數(shù)字世界的互動。

滲透醫(yī)療金融駕駛多領(lǐng)域 AI或?qū)⒊蔀榛A(chǔ)設(shè)施

AIGC交互界面的用戶友好性、大模型開源及API（應(yīng)用程序編程接口）價格的降低、插件服務(wù)帶來的應(yīng)用生態(tài)繁榮等，都使得AI技術(shù)或?qū)⒊蔀橄袼�、電、網(wǎng)絡(luò)一樣的基礎(chǔ)設(shè)施，滲透并改變千行萬業(yè)。根據(jù)愛設(shè)計等多平臺聯(lián)合發(fā)布的《2024年AIGC發(fā)展趨勢報告》，在醫(yī)療領(lǐng)域，AI的應(yīng)用已能夠精準(zhǔn)輔助診斷，例如Google Health的深度學(xué)習(xí)模型，在乳腺癌篩查中的準(zhǔn)確率已超越人類專家。利用強(qiáng)大的圖像識別和模式分析能力，這些模型可以從成千上萬的X光片中識別出極易被人眼忽視的細(xì)微變化。

金融領(lǐng)域也經(jīng)歷了由AI推動的變革。金融機(jī)構(gòu)利用復(fù)雜的算法來預(yù)測市場趨勢、管理風(fēng)險，甚至自動執(zhí)行交易。機(jī)器學(xué)習(xí)技術(shù)能夠分析大規(guī)模的歷史數(shù)據(jù)，識別出人類難以察覺的模式。例如，通過深度學(xué)習(xí)，AI可以在高頻交易中捕捉到微小的市場變化，并在毫秒級做出反應(yīng)，這是任何人類交易者所無法比擬的。

自動駕駛領(lǐng)域的AI應(yīng)用，展示了AI能夠在高度復(fù)雜和動態(tài)的環(huán)境中執(zhí)行任務(wù)的能力。特斯拉的Autopilot、谷歌的Waymo，這些自動駕駛系統(tǒng)使用了先進(jìn)的傳感器陣列和AI算法，實(shí)現(xiàn)了車輛的自主導(dǎo)航和決策。它們的表現(xiàn)日益接近人類駕駛者，甚至在某些情境下超越了人類。

在娛樂和創(chuàng)意產(chǎn)業(yè)中，AI也為人類的創(chuàng)造力打開了新的維度。OpenAI的DALL·E能夠根據(jù)簡短的文本描述生成驚人的圖像作品，AI音樂程序能夠創(chuàng)作出動聽的旋律。這些AI工具不僅激發(fā)了創(chuàng)作者的靈感，也改變了藝術(shù)創(chuàng)作的方式。AI的這一創(chuàng)造性成果是前所未有的，它為人類文化的多樣性貢獻(xiàn)了新的元素。

AI“擅長”生產(chǎn)虛擬內(nèi)容互動娛樂行業(yè)出現(xiàn)重大變革

以生產(chǎn)虛擬內(nèi)容為主的互動娛樂行業(yè)受到了來自AIGC的強(qiáng)大影響。點(diǎn)點(diǎn)數(shù)據(jù)一份關(guān)于AIGC對互動娛樂行業(yè)影響趨勢的洞察報告認(rèn)為，以游戲、視頻、網(wǎng)文、音頻等為主的互動娛樂行業(yè)，不僅在內(nèi)容的生產(chǎn)方式上受AIGC影響產(chǎn)生了結(jié)構(gòu)性的變化，并且內(nèi)容本身的呈現(xiàn)形式也將出現(xiàn)巨大變革。

該報告列舉的案例中，國內(nèi)一款結(jié)合AIGC功能打造的手機(jī)游戲《逆水寒》中首次出現(xiàn)了“智能NPC”。NPC之間會自主地產(chǎn)生交互，且不僅僅是只限于文本內(nèi)容的聊天，而是包含移動、送禮、交易，甚至決斗等行為，并且過程中玩家也可以隨時加入互動，從而影響NPC的行為。更讓玩家意外的是，NPC是具備“記憶”的。如果你對NPC示好，在下一次碰見時，他可能會主動叫住你，和你說一些悄悄話，或就之前的事情再次與你相聊甚歡；而如果玩家與NPC交惡，那NPC也會拒絕和玩家多聊天，甚至一言不合還會兵刃相見。

而游戲中除了智能NPC以外，NPC語音生成、NPC說話口型、玩家創(chuàng)建角色一鍵捏臉（輸入文本即可生成臉型）等系統(tǒng)，也都深度結(jié)合了AIGC功能，并為游戲貢獻(xiàn)了非常高的玩家粘性和話題熱度。

另外一款國產(chǎn)熱門游戲《蛋仔派對》，在2023年6月周年慶版本的更新中，新增了創(chuàng)意工坊“生成器”功能，提供了圖片墻（上傳的圖片自動生成像素圖）、像素文字（輸入文字生成像素圖）、花朵（輸入?yún)?shù)批量生成花朵）三類生成功能。而隨著后續(xù)的版本更新，生成器的功能也在不斷增加和完善，特別是去年12月更新的“萬能生成器”，更是再次突破了UGC創(chuàng)作上限。玩家只需輸入提示詞，就能在游戲內(nèi)直接生成對應(yīng)的物品，并布置到場景之中。

被短視頻制作者熟知的“剪映”App，已可以提供從文案編輯、一鍵成文、視頻生成、AI作圖到最終剪輯成片的一站式服務(wù)，包括：基于用戶輸入的主題和內(nèi)容要點(diǎn)生成文案；根據(jù)文案內(nèi)容一鍵生成視頻并包含配音字幕等基礎(chǔ)視頻內(nèi)容；用戶輸入提示詞即可生成視頻內(nèi)需要的畫面和動圖；內(nèi)置AI寫真、AI特效、AI作圖等功能方便用戶自制素材；人聲美化功能幫助用戶生成個人的音頻數(shù)字分身等等。這些功能都深度結(jié)合了AIGC，即提高了創(chuàng)作效率，也下放了創(chuàng)作門檻。從實(shí)際效果來看，雖然單個功能的效果可能目前很難以與ChatGPT、Midjourney、Stable Diffusion等專業(yè)的圖文生成軟件相媲美，但其提供的資源整合性、使用便利性以及生成素材直接用于視頻剪輯的一致性，讓用戶在使用過程中的實(shí)際體驗(yàn)流暢且高效。

AI發(fā)展應(yīng)尊重人類價值法律法規(guī)不斷完整完善

需要警醒的是，AI在特定領(lǐng)域中的成功，也揭示了其所面臨的限制。隨著AI從實(shí)驗(yàn)室研究走向現(xiàn)實(shí)場景這一過程的推進(jìn)，技術(shù)、法規(guī)、倫理以及社會接受度的挑戰(zhàn)逐漸浮現(xiàn)。要充分發(fā)揮AI的潛能，需要在這些方面尋找平衡，以確保AI技術(shù)能夠在尊重人類價值的同時，推動社會進(jìn)步。

隨著越來越多的內(nèi)容由AIGC生成，內(nèi)容的準(zhǔn)確性和可信度也就成為接下來的關(guān)鍵問題�？梢灶A(yù)見，在未來，AIGC將會引入更多的算法和機(jī)制，以應(yīng)對虛假信息、抄襲和其他違規(guī)行為的挑戰(zhàn)，確保生成內(nèi)容的真實(shí)性、合法性。

企業(yè)層面，例如游戲和軟件平臺Steam在2024年1月10日發(fā)布最新公告，對“AIGC+游戲”的態(tài)度做了大幅調(diào)整。將涉及AIGC的游戲分為了“預(yù)生成內(nèi)容”和“實(shí)時生成內(nèi)容”兩個大類，無論哪一類開發(fā)者都需要提交相關(guān)內(nèi)容來闡述AIGC在游戲開發(fā)和運(yùn)行過程中是如何被運(yùn)用的，并且這些信息也會披露給玩家。與此同時，玩家也可以在游戲中隨時就AIGC相關(guān)內(nèi)容進(jìn)行舉報。這是首次由頭部游戲平臺公開發(fā)表并明確對涉及AIGC相關(guān)產(chǎn)品的態(tài)度。

除了類似Steam這樣的平臺在不斷調(diào)整策略外，全球各國在法律層面也在不斷完善相關(guān)法律法規(guī)。就互娛產(chǎn)品中最常見的圖片內(nèi)容來看，韓國發(fā)布的《生成式AI著作權(quán)指南》，明確AIGC內(nèi)容不受版權(quán)保護(hù)；而美國政府則認(rèn)為由AIGC直接生成的作品不受法律保護(hù)，但通過與AIGC合作、并體現(xiàn)了人類創(chuàng)意成果的作品，是可以獲得版權(quán)保護(hù)的。

在我國，2023年7月13日，國家網(wǎng)信辦等七部門聯(lián)合發(fā)布《生成式人工智能服務(wù)管理暫行辦法》，旨在促進(jìn)生成式人工智能的健康發(fā)展和規(guī)范應(yīng)用，維護(hù)國家安全和社會公共利益，保護(hù)公民、法人和其他組織的合法權(quán)益。北京、上海等地也相繼出臺相關(guān)規(guī)范和條例。

目前，關(guān)于AI的合規(guī)問題主要涉及數(shù)據(jù)、AI產(chǎn)品、個人服務(wù)和行業(yè)應(yīng)用。國際數(shù)據(jù)公司IDC指出，在法律法規(guī)的框架下，所有大模型和AI生態(tài)廠商都必須認(rèn)真對待新一代人工智能產(chǎn)業(yè)中的合法合規(guī)問題，特別是通過算法模型的優(yōu)化，增強(qiáng)人工智能的可解釋性。