首页 > 情感

“AI孙燕姿”创作者*视频播放千万,教程月销三单

情感 2023-05-16

  2023年5月16日(农历2023年3月27日),刚刚过去的“五一”假期里,许久未露面的孙燕姿,现身长沙海潮宇宙音乐节。同时期,“AI孙燕姿”在各大短视频平台走红。真人与AI在不同次元遥相呼应,孙燕姿戏剧性地成为了本与她关系不大的AI领域的主角。

  

  《漠河舞厅》(原唱:柳爽)、《发如雪》(原唱:周杰伦)等歌曲经由“AI孙燕姿”演唱,网友的评价是“重新认识了这些歌曲”。

  

  “AI孙燕姿”版《发如雪》的弹幕

  

  目前,B站上AI孙燕姿翻唱的作品中,播放量高的都能达到百万级,弹幕评论上千条。抖音上“AI孙燕姿”话题也有超1400万播放量,按播放量排序,为首的一支视频有近七千条评论。有听众评价,“AI孙燕姿”一开口,歌就变得“更高级了”。

  

  “AI孙燕姿”顺势成内容标签、自媒体创作风口,不论是音乐垂直账号,还是娱乐营销号。或搬运或自制,都开始参与到“AI孙燕姿”之中,分享着流量红利。

  

  《电商在线》通过对多名幕后创作者的采访了解到,有人因喜爱孙燕姿而投身其中,“用爱发电”,也有人借此牟利,或卖课或“做号”——只是收获不佳,相关技术教程月销三单。

  

  海潮宇宙音乐节现场,有粉丝就“AI孙燕姿”一事,询问孙燕姿本人的看法,她仅笑着回应有听说过,但并无明确评价。其经纪公司则澄清,目前没有委托律师处理相关事宜。

  

  作为现象级事件,“AI孙燕姿”的走红,体现的是AIGC在语音领域的技术“涌现”——从ChatGPT到midjourney(最大的人工智能绘画平台),人工智能浸入对话、绘画,以及如今的音乐。由此带给行业与消费市场诸多新思考——AI孙燕姿是怎么被创造出来的,创作者的诉求是什么?这又是否会改造音乐领域的生产与消费逻辑?

  

  孙燕姿粉丝,用爱发电

  

  “AI孙燕姿”是如何创造出来的?从技术角度理解,这是基于“生成式语音模型”的一款AIGC内容产品(AIgeneratedcontent,人工智能生成内容)。

  

  创作者通过向模型“投喂”孙燕姿语音素材进行音色训练,然后对希望演绎的流行歌曲进行模型推演、音色替换。更简单地说,就是将一个人的声音转换成另一个人的,但保留原声的旋律、节奏和情感,是一种“虚拟翻唱”。

  

  严格意义上,这应当被视作一种“深度仿作”,而非所谓的AI版孙燕姿。业界也有共识,即AI版孙燕姿在声音上不论如何接近本尊,归根到底都只是一场民间模仿秀,与真人有着无法抹除的客观距离。“AI孙燕姿”更完整的说法,也应该是“孙燕姿的AI模仿版”。

  

  “我是孙燕姿的粉丝,在网上听到相关的‘AI孙燕姿’的作品之后,也想听偶像唱一些没唱过的歌曲,就一头扎了进去。”韩龙是一名理工科大学生,热衷于在音乐领域进行“二次创作”。“过去两年有尝试玩一些‘鬼畜’,也积累了一点认知和技术,‘AI孙燕姿’和‘鬼畜’对我来说其实差不多,都是对音乐进行二次加工。”

  

  “AI孙燕姿”的创作门槛并不高。目前最主流的制作工具是“UVR_v5.5.0”和“So-VITS-SVC4.0”,网上有大量公开的“整合包”,用户不需要懂技术,不用自己手动编写算法,直接拿前人搭建好的产品来用就行。

  

  So-VITS-SVC4.0,整合包已设计得颇为“傻瓜式”

  

  相对耗费时间和精力,也有些技术门槛的,是对音频训练素材的整理。“需要准备一些‘干声’,也就是无音乐的纯人声,但孙燕姿的歌曲都有伴奏、间隙,所以得会一些基础的音频剪辑,比如提取人声、把音频剪切成更‘干净’的小片段。”

  

  这是为了最大限度提高语音训练素材的质量,以得到最佳的训练结果。“训练完成后,导入想要替换声音的歌曲,进行模型推演就行了。如果声音不像,就需要加大‘投喂’的音频规模、继续训练、调教参数,直到满意为止。”

  

  能够完成上述操作的,其实已算得上“技术党”。更“小白”的做法,是下载网上自带声音模型的整合包。用户不需要再额外找素材、训练,直接推演生成歌曲就行。

  

  “有一点学习能力、探索精神,一台配置还过得去的电脑,按部就班地跟着教程走,都可以创作出自己的‘AI孙燕姿’。”但韩龙也补充,想要有更好的、更个性化的效果,就得自己来训练模型。

  

  “需要配置N卡(NVIDIA英伟达系列显卡)的电脑,跑一个模型(算法学习输入的音频素材)大概在30—60小时左右,具体做一首歌,耗时半个小时到两个小时的样子。”易仁也是孙燕姿的粉丝,他补充,如果使用带训练成型的模型的整合包,就能帮创作者省下至少30个小时的训练时间。

  

  “如果电脑配置不行,也可以租用一些云端算力。”如今,国内大大小小的云计算平台都有针对AIGC需求推出云端分布式GPU,价格低的仅需几毛钱一小时。“显卡能力越强,训练效率就越高,当然也越贵。”

  

  粗略计算,训练一个“AI孙燕姿”声音模型,外租算力的成本,起步是一两百元左右,仍算得上便宜。所以,一个有意思的问题是:门槛那么低、歌手那么多,为什么最红的是“AI孙燕姿”?

  

  “AI孙燕姿”初始创作者之一Rcell告诉记者,他和团队经过半年时间做了上百组实验,采集了孙燕姿的四张专辑《孙燕姿同名专辑》《克卜勒》《逆光》《是时候》,共计约100首歌曲作为训练数据。“尝试过其他歌手的音色转换,比如周杰伦、林俊杰、王菲等等,但是效果都不如孙燕姿好。孙燕姿的声音清晰、稳定、有特点,而且歌曲风格多样、难度高、情感丰富,所以特别适合做AI训练。”

  

  “孙燕姿被训练得越多,AI的音色质量就越高,就越容易受到市场的追捧,先发优势就像滚雪球一样。”易仁强调,当下对歌手进行AI版复刻的热潮中,“AI孙燕姿”的质量自居一档。


免责声明:以上内容由文文说说网收集整理,文章均来源于网络,转发只是为了更好的传播知识,版权归原作者所有。

本文地址:http://www.shuoshuo.org/qinggan/38898.html
本文标签:

留言与评论(共有 0 条评论)
   
验证码:

文文说说 www.shuoshuo.org

Powered By 文文说说 sitemap