如何在GitHub正确提PR(Pull Requests),给喜欢的开源项目贡献代码by Liu Yue/2024-01-07 标签: github PR Pull Requests 代码 喜欢 如何 开源 正确 贡献 项目 最好的中文TTS项目Bert-vits2更新了中文特化分支,但可能由于时间仓促,代码中存在不少的bug,作为普通用户,有的时候也想为自己喜欢的开源项目做一点点贡献,帮助作者修改一些简单的bug,那么该如何开始? 本次我们以Bert-vits2项目为例子,分享正确提交PR(Pull Requests)的方式。 FORK项目 首先面对一个开源项目,作为普通用户我们有三个选项: &nb......了解更多
首次引入大模型!Bert-vits2-Extra中文特化版40秒素材复刻巫师3叶奈法by Liu Yue/2024-01-06 标签: 40 Bert Extra vits2 中文 叶奈法 复刻 巫师 引入 模型 特化 素材 首次 Bert-vits2项目又更新了,更新了一个新的分支:中文特化,所谓中文特化,即针对中文音色的特殊优化版本,纯中文底模效果百尺竿头更进一步,同时首次引入了大模型,使用国产IDEA-CCNL/Erlangshen-MegatronBert-1.3B大模型作为Bert特征提取,基本上完全解决了发音的bad case,同时在情感表达方面有大幅提升,可以作为先前V1.0.1纯中文版本更好的替代。 更多情报请参见Bert-vits2项目官网:https......了解更多
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言(Python3.10)by Liu Yue/2024-01-04 标签: 16 ai coqui Python3.10 TTS 万国 克隆 同音 字正腔圆 语种 语言 语音 钢铁 按照固有的思维方式,如果想要语音克隆首先得有克隆对象具体的语言语音样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语音克隆技术。 coqui-ai TTS实现跨语种、无需训练克隆语音的方法是基于Tacotron模型,该模型使用了一种音素输入表示来鼓励在不同语种之间共享模型容量。此外,还引入了对抗损失项,以鼓励模型将说话者身份与语音内容进行解耦。这使得模型能够在不同......了解更多
丝丝入扣,毫不违和,AI一键换脸和微调,基于Rope-Ruby,2024最新整合包by Liu Yue/2024-01-03 标签: 2024 ai Rope Ruby 一键 丝丝入扣 基于 微调 换脸 整合 最新 毫不 违和 AI换脸已经不是什么时新的技术了,从DeepFace到Facesweap,再到Roop。AI换脸技术中出现了一种名为“一键换脸”的方法,它不需要训练模型。这种方法利用了名为“GHOST”的技术,它是一种新的一键换脸方法,可以用于图像和视频领域。 这种技术采用了先进的生成对抗网络(GAN)、自动编码器等方法,可以实现精确和稳健的换脸效果。GHOST技术的特点是可以在不需要训练模型的情况下进行换脸,从而实现快速、简单的操作。这......了解更多
Win11环境Mecab日语分词和词性分析以及动态库DLL not found问题(Python3.10)by Liu Yue/2024-01-02 标签: DLL found Mecab Python3.10 Win11 以及 分析 分词 动态 日语 环境 词性 问题 日语因为存在假名,会导致翻译软件进行翻译时机翻味道过重的问题,比如積ん読(つんどく)这个词,大多数软件会翻译成:堆积的读,但其实是明明买了书却不读,光放着的意思。有时候也需要单独查句子中的单词释义来理解句子的意思,但一看下去全是假名,无法像中文或者英文那样进行简单的分词操作。 本次我们基于Python3.10的三方库Mecab来对日语进行分词和词性分析。 安装和配置Mecab 首先下载最新的......了解更多
一键打包,随时运行,Python3项目虚拟环境一键整合包的制作(Venv)by Liu Yue/2023-12-31 标签: python3 Venv 一键 制作 打包 整合 虚拟环境 运行 随时 项目 之前我们介绍了如何使用嵌入式 Python3 环境给项目制作一键整合包,在使用嵌入式 Python 环境时,通常是作为另一个应用程序的一部分,而Python3虚拟环境是为了在开发过程中隔离项目所需的 Python 环境。虚拟环境允许我们在同一台计算机上的不同项目中使用不同的 Python 版本和软件包,而不会相互干扰。 本次我们利用Python3自带的虚拟环境(venv)功能来给项目制作一键整合包。 创建虚拟环境&n......了解更多
免费背景音人声分离解决方案MVSEP-MDX23,足以和Spleeter分庭抗礼by Liu Yue/2023-12-29 标签: MDX23 MVSEP Spleeter 人声 免费 分庭抗礼 分离 背景 解决方案 足以 在音视频领域,把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有原始工程文件的情况下,将其还原和分离是一件很有难度的事情。 言及背景音人声分离技术,就不能不提Spleeter,它是一种用于音频源分离(音乐分离)的开源深度学习算法,由Deezer研究团队开发。使用的是一个性能取向的音源分离算法,并且为用户提供了已经预训练好的模型,能够开箱即用,这也是Spleeter泛用性高的原因之一,关于Spleeter,......了解更多
Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)by Liu Yue/2023-12-27 标签: 2.3 Bert Colab GPU vits2 云端 免费 平台 推理 最终版 算力 训练 对于深度学习初学者来说,JupyterNoteBook的脚本运行形式显然更加友好,依托Python语言的跨平台特性,JupyterNoteBook既可以在本地线下环境运行,也可以在线上服务器上运行。GoogleColab作为免费GPU算力平台的执牛耳者,更是让JupyterNoteBook的脚本运行形式如虎添翼。 本次我们利用Bert-vits2的最终版Bert-vits2-v2.3和JupyterNoteBook的脚本来复刻生化危机6的人气......了解更多
朱令去世,朱令案:不能公开的“内参”by Liu Yue/2023-12-24 标签: 不能 公开 内参 去世 朱令 朱令案 题记 朱令令于公元2023年12月22日在北京去世,生于斯,长于斯,殁于斯。 她的死,让我们想起了臧克家的千古名篇《有的人》:有的人死了, 她还活着;有的人活着, 她已经死了。 而那个女人,她还在澳大利亚,但是她已经死了,没错,她还在呼吸,也许还在工作,但是她的灵魂早已失去了光泽。 事情还没有完全收束,也许是妥协的挣扎,也许是不......了解更多
Bert-vits2-2.3-Final,Bert-vits2最终版一键整合包(复刻生化危机艾达王)by Liu Yue/2023-12-22 标签: 2.3 Bert Final vits2 一键 复刻 整合 最终版 生化危机 艾达王 近日,Bert-vits2发布了最新的版本2.3-final,意为最终版,修复了一些已知的bug,添加基于 WavLM 的 Discriminator(来源于 StyleTTS2),令人意外的是,因情感控制效果不佳,去除了 CLAP情感模型,换成了相对简单的 BERT 融合语义方式。 事实上,经过2.2版本的测试,CLAP情感模型的效果还是不错的,关于2.2版本,请移步:Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文......了解更多
云端开炉,线上训练,Bert-vits2-v2.2云端线上训练和推理实践(基于GoogleColab)by Liu Yue/2023-12-19 标签: Bert GoogleColab v2.2 vits2 云端 基于 实践 开炉 推理 线上 训练 假如我们一定要说深度学习入门会有一定的门槛,那么设备成本是一个无法避开的话题。深度学习模型通常需要大量的计算资源来进行训练和推理。较大规模的深度学习模型和复杂的数据集需要更高的计算能力才能进行有效的训练。因此,训练深度学习模型可能需要使用高性能的计算设备,如图形处理器(GPU)或专用的深度学习处理器(如TPU),这让很多本地没有N卡的同学望而却步。 GoogleColab是由Google提供的一种基于云的免费Jupyter笔记本环境。它可以帮......了解更多
Bert-vits2-v2.2新版本本地训练推理整合包(原神八重神子英文模型miko)by Liu Yue/2023-12-18 标签: Bert miko v2.2 vits2 八重 原神 推理 整合 本地 模型 版本 神子 英文 训练 近日,Bert-vits2-v2.2如约更新,该新版本v2.2主要把Emotion 模型换用CLAP多模态模型,推理支持输入text prompt提示词和audio prompt提示语音来进行引导风格化合成,让推理音色更具情感特色,并且推出了新的预处理webuI,操作上更加亲民和接地气。 更多情报请参见Bert-vits2官网:https://github.com/fishaudio/Bert-VITS2/releases/tag/v2.2&......了解更多
衡兰芷若成绝响,人间不见周海媚(4k修复基于PaddleGan)by Liu Yue/2023-12-16 标签: 4k PaddleGAN 不见 人间 修复 周海媚 基于 绝响 衡兰芷若成 一代人有一代人的经典回忆,1994年由周海媚、马景涛、叶童主演的《倚天屠龙记》曾经风靡一时,周海媚所诠释的周芷若凝聚了汉水之钟灵,峨嵋之毓秀,遇雪尤清,经霜更艳,俘获万千观众,成为了一代人的共同记忆。 如今美人仙去,回望经典,雪肤依然,花貌如昨,白璧微瑕之处是九十年代电视剧的分辨率有些低,本次我们利用百度自研框架PaddleGan的视频超分SOTA算法来对九十年代电视剧进行4K修复。 配置PaddlePaddle框架......了解更多
两亿大奖,一夜暴富,江西彩票、概率学、阴谋论暨景观社会by Liu Yue/2023-12-10 标签: 一夜 两亿 大奖 彩票 景观 暴富 概率 江西 社会 阴谋论 近日,中国福彩“快乐8”选七玩法中有一人投注近5万倍共中2.2亿余元,两个小目标,一夜全自由,如果你以为这是故事,那么你错了,如果你以为这是生活,那么我们都错了。 “快乐8”的快乐是真的快乐 快乐如果也分等级,那“快乐8”选10一等大奖快乐一定比选1的要高级很多。 首先明确一下“快乐8”一等奖的规则:投注人从80个数(1-80)中选10个数,开奖时会从80个数中开出20个......了解更多
Bert-vits2新版本V2.1英文模型本地训练以及中英文混合推理(mix)by Liu Yue/2023-12-08 标签: Bert mix V2.1 vits2 中英文 以及 推理 本地 模型 混合 版本 英文 训练 中英文混合输出是文本转语音(TTS)项目中很常见的需求场景,尤其在技术文章或者技术视频领域里,其中文文本中一定会夹杂着海量的英文单词,我们当然不希望AI口播只会念中文,Bert-vits2老版本(2.0以下版本)并不支持英文训练和推理,但更新了底模之后,V2.0以上版本支持了中英文混合推理(mix)模式。 还是以霉霉为例子:https://www.bilibili.com/video/BV1bB4y1R7Nu/ 截取......了解更多
义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)by Liu Yue/2023-11-29 标签: Bert Python3.10 vits2V210 义无反顾 复刻 实践 督工 Bert-vits2更新了版本V210,修正了日/英的bert对齐问题,效果进一步优化;对底模使用的数据进行优化和加量,减少finetune失败以及电音的可能性;日语bert更换了模型,完善了多语言推理。 更多情报请参考Bert-vits2官网:https://github.com/fishaudio/Bert-VITS2/releases/tag/2.1 最近的事情大家也都晓得了,马督工义无反顾带头冲锋,身体力行地......了解更多
本地训练,立等可取,30秒音频素材复刻霉霉讲中文音色基于Bert-VITS2V2.0.2by Liu Yue/2023-11-27 标签: 30 Bert vits2V2.0 中文 基于 复刻 本地 立等可取 素材 训练 霉霉 音色 音频 之前我们使用Bert-VITS2V2.0.2版本对现有的原神数据集进行了本地训练,但如果克隆对象脱离了原神角色,我们就需要自己构建数据集了,事实上,深度学习模型的性能和泛化能力都依托于所使用的数据集的质量和多样性,本次我们在本地利用Bert-VITS2V2.0.2对霉霉讲中文的音色进行克隆实践。 霉霉讲中文的原始音视频地址:https://www.bilibili.com/video/BV1bB4y1R7Nu/ &nb......了解更多
中国版OJ辛普森案,朱令案暨疑罪从无by Liu Yue/2023-11-26 标签: OJ 中国 朱令案 疑罪从无 辛普森 楔子 毫无疑问,面对一桩刑事案件时,旁观者始终处于一个脆弱无知的状态。人们会被无数可能的事情影响对某件事情的判断 ,而真相,只有那个人知道。因此法治社会下不得不倚重于法律程序来做出判断。而一旦执掌法律武器的权力机构受到质疑,事情的发展通常都会是灾难性的。 1994年,前美式橄榄球运动员O·J·辛普森(O.J. Simpson)杀妻一案成为当时美国最为轰动的事件......了解更多
本地训练,开箱可用,Bert-VITS2 V2.0.2版本本地基于现有数据集训练(原神刻晴)by Liu Yue/2023-11-22 标签: Bert V2.0 vits2 原神刻 可用 基于 开箱 数据 本地 版本 现有 训练 按照固有思维方式,深度学习的训练环节应该在云端,毕竟本地硬件条件有限。但事实上,在语音识别和自然语言处理层面,即使相对较少的数据量也可以训练出高性能的模型,对于预算有限的同学们来说,也没必要花冤枉钱上“云端”了,本次我们来演示如何在本地训练Bert-VITS2 V2.0.2模型。 Bert-VITS2 V2.0.2基于现有数据集 目前Bert-VITS2 V2.0.2大体上有两种训练方式,第一种是基于现有数据集,即原......了解更多
又欲又撩人,基于新版Bert-vits2V2.0.2音色模型雷电将军八重神子一键推理整合包分享by Liu Yue/2023-11-20 标签: Bert vits2V2.0 一键 八重 分享 基于 将军 推理 撩人 整合 新版 模型 神子 雷电 音色 Bert-vits2项目近期炸裂更新,放出了v2.0.2版本的代码,修正了存在于2.0先前版本的重大bug,并且重炼了底模,本次更新是即1.1.1版本后最重大的更新,支持了三语言训练及混合合成,并且做到向下兼容,可以推理老版本的模型,本次我们基于新版V2.0.2来本地推理原神小姐姐们的音色模型。 具体的更新日志请参见官网:https://github.com/fishaudio/Bert-VITS2/releases ......了解更多