電子發燒友網報道(文/黃山明)就在近期,華語樂壇的不少歌迷喜氣洋洋,認為目前的歌壇回到了20年前,歌迷們又享受到了許多動聽的歌聲。不過與以往不同的是,這些演唱者并非真人,而是一個個訓練出來的AI。
這些AI足以以假亂真,通過技術將一首音樂以更換演唱者的方式來進行不同的演繹,不僅為歌壇帶來了不一樣的視聽體驗,同時也引發了行業對AI技術應用的思考。在AI時代,我們的所見所聞,或許都是由AI創造的。
光怪陸離的AI時代
如今的網絡上有一個梗,要問今年哪個歌手最火,答案可能會出乎許多人意料,并不是某位歌手,而是一些由AI所制作出來的語音,如AI孫燕姿、AI周杰倫等。通過將原來歌手的聲音進行采集訓練,從而替換另一首歌的原唱。
通過這種方式,實現了讓自己喜歡的歌手唱另一首自己喜歡但非歌手的歌,比如用孫燕姿的聲音演唱周杰倫的《晴天》。關鍵在于,不論是演唱語調、技巧乃至音色,幾乎都與孫燕姿相差無幾。
實現這一技術目前已經有一套標準流程,先通過收集大量的音樂和歌詞,并對這些數據進行清洗和標注,以便訓練算法和模型。再選擇合適的算法和模型,并進行優化和調整,以提高虛擬人物的歌唱和表演能力。
通過語音合成技術將文字轉換為聲音,并對聲音進行處理和優化,以達到更加自然和流暢的效果。最后將原來歌曲的聲音替換成語音合成的聲音,再進行調試,就能得到一首全新演唱的歌曲。
既然都已經可以替換聲音演唱歌曲了,那么更進一步替換視頻畫面進行演繹也就不太難了。近期谷歌的I/O大會上,便公布了一項Universal Translator技術,該工具旨在將視頻從一種語言翻譯成另一種語言,同時保留整體基調和氛圍。
這意味著該技術不僅可以將音頻從一種語言翻譯成另一種語言,還可以模仿說話者的聲音、語氣和面部表情,人物說話視頻會根據目標語言的發音同步改變口型。
當然,為了避免這項技術被用來制作虛假視頻,谷歌將這項技術只授權給少部分的合作廠商使用,普通人是無法接觸到的。但市場上如今已經有許多類似的AI出現,谷歌的此舉不過是略作限制,但無法阻止這股趨勢。
更有甚者,如一位美國網紅發布了AI版本的自己“Caryn AI”,這個應用是一款聊天機器人,可以作為用戶的虛擬伴侶,目前正在內部測試階段,每分鐘收費一美元。
據美國雜志《財富》披露,就在過去一周的時間內,這款軟件已經為其創造了7.16萬美元(約合人民幣50萬元)的收入,已經吸引了超過1000名付費粉絲。
這種模式或許也將沖擊未來的娛樂行業,想象每一位追星的粉絲,只要付費,都將擁有與自己偶像一對一聊天的機會,其所創造的價值潛力將是巨大的。
但這種由AI所創造出來的音樂、視頻、伴侶或者偶像,真的可以提供人們所需要的情緒價值嗎?這是個值得思考的問題。
AI之后的隱憂
盡管這些AI應用的落地前景非常誘人,比如采用AI替換歌曲中的聲音,就能夠實現歌手只需要提供聲音的模板,便可以進行批量的音樂制作。甚至不用自己演唱,也能夠推行相關專輯。
技術上主要通過機器學習技術,訓練機器模仿一個特定的歌手的音樂風格、聲音和唱腔,然后將這些技能應用于其他歌曲的錄制中。這種技術在一定程度上提高了錄制歌曲的效率和質量,并且可以節省制作成本。
但如果使用他人的聲音進行創作,就可能有侵權的風險。尤其在數據采集階段,以語音替換為例,首先需要收集大量的語音數據,并對這些數據進行標注和處理。標注可以包括音素、語調、語速等信息,以便訓練模型能夠準確地識別和替換語音。
這一過程便可能涉及到對用戶隱私數據的采用,甚至對用戶的隱私和數據安全造成威脅,還有可能進一步造成財產安全。因為語音合成就可能被犯罪分子用于詐騙,通過合成親屬或者熟人的聲音來謀取資金。
如果用AI更改視頻畫面甚至進一步篡改其中的對話,則可能造成更多的風險。比如將會遇到即便是用視頻聊天,也無法確定對面的是不是真的想要聯系的那個人。這項技術目前甚至已經應用在許多的直播平臺中,比如一些虛擬主播、虛擬偶像等,如果一旦濫用,可能會造成更多的危害。
為了避免這一情況的發生,除了加強對AI技術的監管,建立相應的法律制度和規范,還可以通過一些技術手段來避免自身的數據被采集,從而造成侵權以及侵犯隱私的風險。比如采用區塊鏈技術來保護數據的安全性和隱私性,采用人工智能算法來檢測和識別惡意行為等手段。
以區塊鏈技術為例,其去中心化和不可變性特點能夠確保數據的安全和完整性,因此可以用于AI技術的安全驗證和認證?;趨^塊鏈技術,數據交互和交流的過程被保護,因此可以授權AI對數據的操作并確保AI數據訪問權限受到限制。
同時,區塊鏈技術還可以幫助人們更好地控制AI技術的使用,并提高AI的公正和透明性。例如,以基于區塊鏈技術的智能合約的方式來控制AI的使用,可以加強對AI系統的監督,并確保其行為符合人類的期望和價值。
當然,區塊鏈技術還面臨著可擴展性、隱私保護等問題,同時在操作成本和技術難度方面也存在一定的限制,還無法完全避免AI濫用的問題。
我們還可以運用數字簽名技術檢測音頻和視頻是否被AI修改,數字簽名是指在文件中包含數字代碼的技術,在將文件傳輸或轉發給其他人時,可以驗證文件的完整性和真實性?;蛘呤褂脵C器學習算法來檢測這些變化,例如,可以使用深度神經網絡來對音頻或視頻進行分析,以檢測其中的模式和結構是否與人類創作者的作品相似。如果發現有明顯的差異,則可能表明該作品是由AI生成的。
但隨著未來AI技術的發展,這些差異化和容易被檢測出來的問題都有可能被AI克服,使得我們最終很難分辨哪些產品是由AI制作,哪些才是由人所原創的。
寫在最后
隨著生成式AI技術的大爆發,如ChatGPT、文心一言、訊飛星火等聊天機器人的出現,讓人們工作效率得以極大地提高,Stable Diffusion、Midjourney等AI的出現,讓圖片制作成本大幅降低,Universal Translator、Video Dubbing AI等,讓視頻也開始變得容易制作。
這些AI技術的出現顯然極大的解放了人們的生產力,讓人類發展走上快車道。當然有人會說以上這些AI都是通過收集大量數據之后,輸出縫合之后的產品,根本不能稱得上是原創。
但就像我們的學習過程一樣,最開始都是模仿,后來才開始擁有自己的獨立風格,但這些風格或多或少都會有之前學習過的影子,而這就是創造的過程,AI也是如此。
更值得關注的是,隨著AI技術的快速發展,其所帶來的風險也在與日俱增。如何更好的處理AI所引發的風險,將是我們未來所面對的主要問題。
這些AI足以以假亂真,通過技術將一首音樂以更換演唱者的方式來進行不同的演繹,不僅為歌壇帶來了不一樣的視聽體驗,同時也引發了行業對AI技術應用的思考。在AI時代,我們的所見所聞,或許都是由AI創造的。
光怪陸離的AI時代
如今的網絡上有一個梗,要問今年哪個歌手最火,答案可能會出乎許多人意料,并不是某位歌手,而是一些由AI所制作出來的語音,如AI孫燕姿、AI周杰倫等。通過將原來歌手的聲音進行采集訓練,從而替換另一首歌的原唱。
通過這種方式,實現了讓自己喜歡的歌手唱另一首自己喜歡但非歌手的歌,比如用孫燕姿的聲音演唱周杰倫的《晴天》。關鍵在于,不論是演唱語調、技巧乃至音色,幾乎都與孫燕姿相差無幾。
實現這一技術目前已經有一套標準流程,先通過收集大量的音樂和歌詞,并對這些數據進行清洗和標注,以便訓練算法和模型。再選擇合適的算法和模型,并進行優化和調整,以提高虛擬人物的歌唱和表演能力。
通過語音合成技術將文字轉換為聲音,并對聲音進行處理和優化,以達到更加自然和流暢的效果。最后將原來歌曲的聲音替換成語音合成的聲音,再進行調試,就能得到一首全新演唱的歌曲。
既然都已經可以替換聲音演唱歌曲了,那么更進一步替換視頻畫面進行演繹也就不太難了。近期谷歌的I/O大會上,便公布了一項Universal Translator技術,該工具旨在將視頻從一種語言翻譯成另一種語言,同時保留整體基調和氛圍。
這意味著該技術不僅可以將音頻從一種語言翻譯成另一種語言,還可以模仿說話者的聲音、語氣和面部表情,人物說話視頻會根據目標語言的發音同步改變口型。
當然,為了避免這項技術被用來制作虛假視頻,谷歌將這項技術只授權給少部分的合作廠商使用,普通人是無法接觸到的。但市場上如今已經有許多類似的AI出現,谷歌的此舉不過是略作限制,但無法阻止這股趨勢。
更有甚者,如一位美國網紅發布了AI版本的自己“Caryn AI”,這個應用是一款聊天機器人,可以作為用戶的虛擬伴侶,目前正在內部測試階段,每分鐘收費一美元。
據美國雜志《財富》披露,就在過去一周的時間內,這款軟件已經為其創造了7.16萬美元(約合人民幣50萬元)的收入,已經吸引了超過1000名付費粉絲。
這種模式或許也將沖擊未來的娛樂行業,想象每一位追星的粉絲,只要付費,都將擁有與自己偶像一對一聊天的機會,其所創造的價值潛力將是巨大的。
但這種由AI所創造出來的音樂、視頻、伴侶或者偶像,真的可以提供人們所需要的情緒價值嗎?這是個值得思考的問題。
AI之后的隱憂
盡管這些AI應用的落地前景非常誘人,比如采用AI替換歌曲中的聲音,就能夠實現歌手只需要提供聲音的模板,便可以進行批量的音樂制作。甚至不用自己演唱,也能夠推行相關專輯。
技術上主要通過機器學習技術,訓練機器模仿一個特定的歌手的音樂風格、聲音和唱腔,然后將這些技能應用于其他歌曲的錄制中。這種技術在一定程度上提高了錄制歌曲的效率和質量,并且可以節省制作成本。
但如果使用他人的聲音進行創作,就可能有侵權的風險。尤其在數據采集階段,以語音替換為例,首先需要收集大量的語音數據,并對這些數據進行標注和處理。標注可以包括音素、語調、語速等信息,以便訓練模型能夠準確地識別和替換語音。
這一過程便可能涉及到對用戶隱私數據的采用,甚至對用戶的隱私和數據安全造成威脅,還有可能進一步造成財產安全。因為語音合成就可能被犯罪分子用于詐騙,通過合成親屬或者熟人的聲音來謀取資金。
如果用AI更改視頻畫面甚至進一步篡改其中的對話,則可能造成更多的風險。比如將會遇到即便是用視頻聊天,也無法確定對面的是不是真的想要聯系的那個人。這項技術目前甚至已經應用在許多的直播平臺中,比如一些虛擬主播、虛擬偶像等,如果一旦濫用,可能會造成更多的危害。
為了避免這一情況的發生,除了加強對AI技術的監管,建立相應的法律制度和規范,還可以通過一些技術手段來避免自身的數據被采集,從而造成侵權以及侵犯隱私的風險。比如采用區塊鏈技術來保護數據的安全性和隱私性,采用人工智能算法來檢測和識別惡意行為等手段。
以區塊鏈技術為例,其去中心化和不可變性特點能夠確保數據的安全和完整性,因此可以用于AI技術的安全驗證和認證?;趨^塊鏈技術,數據交互和交流的過程被保護,因此可以授權AI對數據的操作并確保AI數據訪問權限受到限制。
同時,區塊鏈技術還可以幫助人們更好地控制AI技術的使用,并提高AI的公正和透明性。例如,以基于區塊鏈技術的智能合約的方式來控制AI的使用,可以加強對AI系統的監督,并確保其行為符合人類的期望和價值。
當然,區塊鏈技術還面臨著可擴展性、隱私保護等問題,同時在操作成本和技術難度方面也存在一定的限制,還無法完全避免AI濫用的問題。
我們還可以運用數字簽名技術檢測音頻和視頻是否被AI修改,數字簽名是指在文件中包含數字代碼的技術,在將文件傳輸或轉發給其他人時,可以驗證文件的完整性和真實性?;蛘呤褂脵C器學習算法來檢測這些變化,例如,可以使用深度神經網絡來對音頻或視頻進行分析,以檢測其中的模式和結構是否與人類創作者的作品相似。如果發現有明顯的差異,則可能表明該作品是由AI生成的。
但隨著未來AI技術的發展,這些差異化和容易被檢測出來的問題都有可能被AI克服,使得我們最終很難分辨哪些產品是由AI制作,哪些才是由人所原創的。
寫在最后
隨著生成式AI技術的大爆發,如ChatGPT、文心一言、訊飛星火等聊天機器人的出現,讓人們工作效率得以極大地提高,Stable Diffusion、Midjourney等AI的出現,讓圖片制作成本大幅降低,Universal Translator、Video Dubbing AI等,讓視頻也開始變得容易制作。
這些AI技術的出現顯然極大的解放了人們的生產力,讓人類發展走上快車道。當然有人會說以上這些AI都是通過收集大量數據之后,輸出縫合之后的產品,根本不能稱得上是原創。
但就像我們的學習過程一樣,最開始都是模仿,后來才開始擁有自己的獨立風格,但這些風格或多或少都會有之前學習過的影子,而這就是創造的過程,AI也是如此。
更值得關注的是,隨著AI技術的快速發展,其所帶來的風險也在與日俱增。如何更好的處理AI所引發的風險,將是我們未來所面對的主要問題。
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。
舉報投訴
-
谷歌
+關注
關注
27文章
6161瀏覽量
105300 -
AI
+關注
關注
87文章
30728瀏覽量
268886 -
AIGC
+關注
關注
1文章
361瀏覽量
1539
發布評論請先 登錄
相關推薦
英偉達新一代AI芯片過熱問題引關注
近日,英偉達新一代Blackwell AI芯片遭遇過熱問題,這一消息引發了業界的廣泛關注。據悉,搭載該芯片的服務器在運行過程中存在過熱現象,可能影響其正常交付,這令谷歌、微軟等潛在客戶感到擔憂。
特斯拉加大AI投資,緯創成AI服務器市場贏家
近日,特斯拉宣布將全力沖刺AI投資,主要用于訓練自動駕駛系統。為實現這一目標,特斯拉計劃在得州超級工廠大幅增加AI服務器的數量,從目前的2.9萬組提升至5萬組,增幅超過七成。
下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI中更快的嵌入處理
電子發燒友網站提供《下一代高功能新一代AI加速器(DRP-AI3):10x在高級AI系統高級AI
發表于 08-15 11:06
?0次下載
爆火!產能激增800%!
,SK海力士的1b DRAM產能預計將從第一季度的每月1萬片晶圓增加到年底的每月9萬片,增幅達800%, 且這一目標較去年年末給出的7萬片目標高出近三成。SK海力士還計劃到明年上半年將1b DRAM產量增加到14萬至15萬片,是
商湯科技:AI 2.0時代的“新質生產力工具”
2024年全球開發者先鋒大會(GDC)在上海盛大開幕,匯聚了全球頂尖的開發者與科技創新者。商湯科技董事長兼CEO徐立受邀出席,并發表了題為《AI 2.0時代的“新質生產力工具”》的主旨演講,引發了廣泛關注和深度思考。
AI時代,憶恒創源如何定義SSD?
AI技術的飛速發展,存儲行業迎來了前所未有的挑戰與機遇。AI對算力的需求推動了存儲技術的進步,在這一背景下,作為一家成立于2011年的本土企業級SSD廠商,憶恒創源不斷探索如何提升存儲
榮耀引領端側AI新時代
在今年的MWC盛會上,榮耀宣布與高通、Meta攜手,將70億參數大模型引入端側,這一創新舉措預示著端側AI新時代的到來。榮耀終端CEO趙明在發布會上詳細介紹了榮耀魔法大模型,并通過現場
是德科技如何賦能醫療AI大模型應用呢?
自從ChatGPT爆火以來,各種AI大模型紛紛亮相,如百度科技的文心一言,科大訊飛的訊飛星火,華為的盤古AI大模型,騰訊的混元
聯想今年將發布AI OS操作系統
聯想正式宣布,將把AI PC和個人Agent作為2024年的核心業務推進重點,并計劃在今年內推出全新的“AI OS操作系統”以及一系列搭載此系統的“
智譜AI推出新一代基座大模型GLM-4
智譜AI近日宣布推出新一代基座大模型GLM-4。這一模型在整體性能上相較上一代實現了大幅提升,其表現已逼近GPT-4。
評論