4月17日,昆侖萬維公司公布了天工3.0大模型的優異性能,同時啟動了天工SkyMusic音樂大模型的公益試用。
天工3.0擁有4000億參數,超越Grok-1的3140億參數,成為全球最大的開源MoE大模型。該模型在語義理解、邏輯推理、通用性、泛化性、不確定性知識以及學習能力等方面均有顯著提升,數學/推理/代碼/文創能力提高超過30%。此外,天工3.0還新增了多輪搜索與綜合工具調用、圖表繪制、研究模式、增強模式、改圖擴圖等AI功能。
天工SkyMusic音樂大模型也于同日開啟公益試用。昆侖萬維表示,天工SkyMusic在人聲&BGM音質、人聲自然度、發音可懂度等方面明顯優于競爭對手,綜合性能超越Suno V3,成為音樂大模型中的最高水準。
天工SkyMusic采用音樂音頻領域類Sora模型架構,Large-scale Transformer負責譜曲,學習Music Patches的上下文依賴關系,實現音樂可控性;而Diffusion Transformer則負責演唱,通過LDM將Music Patches還原為高質量音頻,支持生成80秒44100Hz采樣率雙聲道立體聲歌曲。
據悉,天工SkyMusic具有以下特色:
1. 高質量AI音樂:生成80秒44100Hz采樣率雙聲道立體聲AI歌曲
2. 人聲“以假亂真”:中文發音清晰無異響
3. 歌詞段落控制:歌曲能明確區分不同段落的情感變化
4. 多種音樂風格:支持說唱/民謠/放克/古風/電子等
5. 音樂智能表達:學習顫音、歌劇、吟唱、男女對唱等歌唱技巧
6. 參考音樂生成:用戶上傳參考音樂,生成相似風格和唱腔的歌曲
7. 方言歌曲生成:支持粵語、成都話、北京話等眾多方言
-
開源
+關注
關注
3文章
3309瀏覽量
42471 -
LDM
+關注
關注
0文章
6瀏覽量
10647 -
大模型
+關注
關注
2文章
2423瀏覽量
2641 -
昆侖萬維
+關注
關注
0文章
17瀏覽量
11
發布評論請先 登錄
相關推薦
評論