偶然的机会在Github上看到了一个月有趣的项目,于是Clone下来玩玩。

项目地址:https://github.com/babysor/MockingBird

然后下载一个模型文件:https://pan.baidu.com/s/1iONvRxmkI-t1nHqxKytY3g 提取码: 4j5d

将下载的文件 放到 synthesizer/saved_models 下,就可以了

然后直接运行 demo_toolbox.py

如下图:


接下来就要准备需要模拟的声音文件了,接下来我想到一个比较有意思的方案

从网站上获取歌手的mp3文件,或者是获取别人的访谈视频。

通过ffmpeg可以将mp4文件直接转换成wav文件

ffmpeg -i x.mp4 x.wav

如果是英语的话,就需要用到“人声提取器”,有在线的网站:https://ezstems.com/

然后就可以愉快的玩耍了,不过目前的效果还是不好,最好是多下载一些训练素材,自己来训练模型,至于下一步的话                                         

to be continued.