聲音克隆竟然可以月入萬元,保姆級教程,附帶全套操作軟件
可能有很多人都沒有聽過【聲音克隆】這個名詞,因為它本來就屬于小眾賽道,我們不要小看小眾賽道哦,需求可以大大的有的。通過這幾個月實操來看,【聲音克隆】的需求主要是幾個方面:
1、做自媒體的群體。網上的AI配音雖然大把的有,但同質化特別嚴重,有時候是幾千人用一個配音去做視頻和音頻,沒有特色,如果能用自己的或者特定的音色去配音,效果會更加好,其中最典型的需求是直播間,有幾十個案例都是直播間的音色克隆,然后用直播的時候配畫外音。
2、公司宣傳片。7月有個公司做聲音克隆,就是老板太忙,沒有時間去配音, 就做了他的聲音克隆,然后公司老板聽了之后覺得效果還不錯,又克隆了他們公司兩個女生的聲音去做配音。
3、偶像聲音克隆。那種小迷妹特別著迷偶像的聲音,會花大價錢去做克隆,還有一些聲優的聲音,也是頻繁克隆的對象,我還做過幾個韓國歐巴的聲音克隆,永遠不要低估迷妹的消費能力,果然女生都是聽覺動物,男人聲音好聽就是優勢大,不像我是公鴨嗓,哈哈。
4、歌曲翻唱。這些就是適合
那些五音不全的男生女生,唱歌會跑調的那種,希望克隆聲音去翻唱,包括唱英文歌,韓文歌這些都是我們的客戶群體。(蝸牛知享網創資源站www.0298090.com)
5、親人的聲音克隆。這最后一種就是留一個念想,克隆爺爺奶奶的聲音,克隆父母聲音等等,我這邊有一個案例是克隆他過世老師的聲音,在我這里消費了1000+
其實還有一些聲音克隆的需求也蠻有錢途,不太好明說,有興趣的可以來私下問我哈。
三、項目優勢與變現途徑
很多小伙伴可能心里開始打鼓了,聲音克隆這么高大上的項目,操作肯定很麻煩,在這里我告訴你,操作很簡單,小學畢業都可以,只要你會操作電腦,熟練之后,我現在做個聲音克隆實際操作時間只需要10分鐘左右,然后掛在電腦上AI自動訓練幾個小時,無需人為其他操作,一臺電腦一天可以做了3-4個,可變現800以上。
聲音克隆項目目前處在一個發展期的階段,就是由于不夠成熟,普通人進去都能分一杯羹的,做為副業是非常理想的項目(教授微信82342198)
1、屬于比較新興小眾的賽道,從這幾個月咨詢量來看,需求其實還是蠻大的,問的人很多。
2、競爭不是很大,不像普通的電商,哪個類目都是一堆人
3、單價可以達到150-300之間,成交率可以說非常高,平均咨詢3個人就有一個成交,而且客戶的態度相當好,把你當做大神,我接單都是高姿態,先付定金再開始!
現階段主要的變現平臺在閑魚和淘寶,為什么選擇在閑魚這個平臺?因為聲音克隆這個是屬于上不了臺面的偏門應用,閑魚的用戶流量大,各式各樣花式的服務都有,客戶群體已經有了這個習慣,客戶8成來自于閑魚,2成來自于淘寶,其實高成交率,高客單價也是需要話術和技巧的,所以這幾個月我也總結了一套包括爆款主圖、文案、成交話術,特別好用!
當然你想一招吃遍天下是肯定不行的,技術在發展和進步,各類新的開源軟件層出不窮,需要我們要多去關注【聲音克隆】領域新的東西,比如bert-vits2,代碼剛迭代到了第二代,用法更加復雜但效果更加逼真,等到成熟以后我會在后面再和大家分享,所以我每天都會花兩個小時去了解和學習最新的AI技術,現在我基本成為了聲音克隆領域的一個小玩家。
四、聲音克隆實操
目前市面上常用的聲音克隆是 sovits 和 bert-vits2,其中sovits出來時間長一些,更加成熟,克隆的音色相似度也比較高,最大的優點就是訓練花費的時間比較短,幾個小時就搞定了。(蝸牛知享網創資源站www.0298090.com)
下面是實操部分:
準備工作:普通的電腦+顯存8G的N卡即可+硬盤40G以上
操作步驟(sovits):
1、準備30分鐘左右干凈的音頻,
干凈的意思就是只有一個人的聲音+沒有背景音色+一些雜音,推薦處理軟件Audition,Ultimate Vocal Remover(通用軟件鏈接我放在文章的底部,所有軟件都是絕對免費的,自行下載即可),導出為wav格式的音頻,格式不能弄錯,必須是wav格式。
2、聲音切片,把大段音頻切成15秒左右的音頻切片,用的軟件是Audio Slicer,一鍵切片
3、對切出來的音頻重命名,
把批文件處理文件拷貝到視頻切片的文件夾,雙擊 批量重命名.bat,完成后刪掉(注:不重命名的話可能會報錯,提示找不到文件)
4、解壓縮主文件包so-vits-svc.zip到硬盤上,
注意路徑最好不要有中文,拷貝視頻切片文件夾到.so-vits-svcdataset_raw中
恭喜你,到現在為止準備工作已經做完,只剩下最后兩個軟件步驟了哈
5、雙擊.so-vits-svc啟動webui.bat,
啟動軟件,建議安裝谷歌瀏覽器,其他瀏覽器可能會出問題
6、點擊【訓練】標簽,
然后點擊【識別數據集】,再點擊【數據預處理】
7、【數據預處理】完成后,
修改圖片上面的數值為4或者更小,點擊【寫入配置文件】
8、配置文件寫入完成后,
點擊【從頭開始訓練】,點擊后會彈出一個后臺窗口,大概出現下圖的情況說明已經成功了,然后就是等待訓練過程了。
9、訓練出來的模型放在.so-vis-svclogs44K 文件夾,
軟件800步就會自動保存一次,一般20000步左右,效果就差不多了,當然你想繼續訓練也是可以的,有個客戶就讓我訓練了80000步,收費也是按照訓練步數來收費。
10、查看訓練效果
點擊.so-vits-svc啟動tensorboard.bat,拷貝http://localhost冒號6006 到谷歌瀏覽器中打開,點擊頁碼標簽【AUDIO】,試聽克隆語音是否相似,如果滿意就可以停止訓練了
11、交付給客戶
把模型文件和軟件上傳到百度網盤,發鏈接即可!注意,幫客戶環境部署也是可以收費的,我一般收28 - 58之間。
五、總結一下:
各位每一步都要嚴格按照我的流程走,不要自己想當然,開源軟件一般都是不太成熟的,沒有太好的糾錯機制,可能在這個過程中會出現一些報錯,懂程序的可以自己去研究,不懂程序的小伙伴們可以咨詢我,我會盡力幫大家解決報錯的問題。
六、文中所有軟件鏈接
添加蝸牛教授微信82342198,發送關鍵詞:聲音克隆,即可領取。
本站資源來自會員發布以及互聯網公開收集,如遇充值環節或綁定支付賬戶等異常步驟,建議停止操作,是否有風險請自行甄別,本站概不負責。
本站內容僅提供資源分享,不提供任何的一對一教學指導,不提供任何收益保障;若資源無法下載請聯系客服微信:82342198