免费背景音人声分离解决方案MVSEP-MDX23,足以和Spleeter分庭抗礼by Liu Yue/2023-12-29 标签: MDX23 MVSEP Spleeter 人声 免费 分庭抗礼 分离 背景 解决方案 足以 在音视频领域,把已经发布的混音歌曲或者音频文件逆向分离一直是世界性的课题。音波混合的物理特性导致在没有原始工程文件的情况下,将其还原和分离是一件很有难度的事情。 言及背景音人声分离技术,就不能不提Spleeter,它是一种用于音频源分离(音乐分离)的开源深度学习算法,由Deezer研究团队开发。使用的是一个性能取向的音源分离算法,并且为用户提供了已经预训练好的模型,能够开箱即用,这也是Spleeter泛用性高的原因之一,关于Spleeter,......了解更多
Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)by Liu Yue/2023-12-27 标签: 2.3 Bert Colab GPU vits2 云端 免费 平台 推理 最终版 算力 训练 对于深度学习初学者来说,JupyterNoteBook的脚本运行形式显然更加友好,依托Python语言的跨平台特性,JupyterNoteBook既可以在本地线下环境运行,也可以在线上服务器上运行。GoogleColab作为免费GPU算力平台的执牛耳者,更是让JupyterNoteBook的脚本运行形式如虎添翼。 本次我们利用Bert-vits2的最终版Bert-vits2-v2.3和JupyterNoteBook的脚本来复刻生化危机6的人气......了解更多
人工智能AI库Spleeter免费人声和背景音乐分离实践(Python3.10)by Liu Yue/2023-04-17 标签: ai Python3.10 Spleeter 人声 人工智能 免费 分离 实践 背景音乐 在视频剪辑工作中,假设我们拿到了一段电影或者电视剧素材,如果直接在剪辑的视频中播放可能会遭遇版权问题,大部分情况需要分离其中的人声和背景音乐,随后替换背景音乐进行二次创作,人工智能AI库Spleeter可以帮我们完成大部分素材的人声和背景音乐的分离流程。 Spleeter的模型源来自最大的音乐网站Deezer,底层基于深度学习框架Tensorflow,它可以通过模型识别出素材中的背景音乐素材,从而判断出哪些是背景音乐,哪些是外部人声。&nbs......了解更多
口播神器,基于Edge,微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)by Liu Yue/2023-03-07 标签: Edge Python3.10 speech text TTS 免费 口播 合成 基于 实践 开源 微软 文字 神器 语音 不能否认,微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的,一如ChatGPT在NLP领域的随心所欲,予取予求。君不见几乎所有的抖音营销号口播均采用微软的语音合成技术,其影响力由此可见一斑,仅有的白璧微瑕之处就是价格略高,虽然国内也可以使用科大讯飞语音合成进行平替,但我们只想要最好的那一个,本次我们使用免费的开源库edge-tts来实现文本转语音操作,薅微软edge的羊毛。 TTS文本转语......了解更多
吾剑未尝不利,国内Azure平替,科大讯飞人工智能免费AI语音合成(TTS)服务Python3.10接入by Liu Yue/2023-02-08 标签: ai Azure Python3.10 TTS 不利 人工智能 免费 合成 国内 平替 接入 服务 未尝 科大 语音 微软Azure平台的语音合成(TTS)技术确实神乎其技,这一点在之前的一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),已经做过详细介绍,然则Azure平台需要信用卡验证,有一定门槛,对国内用户不太友好,放眼神州,科大讯飞的讯飞开放平台也有语音合成服务接口,可以通过语音合成流式接口将文字信息转化为声音信息。 创建语音应用 首先注册讯飞开放平台,随后创建语音......了解更多
含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入)by Liu Yue/2022-11-27 标签: ai Azure Python3.10 TTS 人工智能 免费 史上 合成 含辞 声若 幽兰 微软 接入 最强 服务 语音 所谓文无第一,武无第二,云原生人工智能技术目前呈现三足鼎立的态势,微软,谷歌以及亚马逊三大巨头各擅胜场,不分伯仲,但目前微软Azure平台不仅仅只是一个PaaS平台,相比AWS,以及GAE,它应该是目前提供云计算人工智能服务最全面的一个平台,尤其是语音合成领域,论AI语音的平顺、自然以及拟真性,无平台能出其右。 本次,我们通过Python3.10版本接入Azure平台语音合成接口,打造一款本地的TTS服务(文本转语音:Text To Spee......了解更多
Python3利用Twilio(国际)以及腾讯云服务(国内)免费发送手机短信by Liu Yue/2020-05-25 标签: python3 Twilio 以及 免费 利用 发送 国内 国际 手机短信 服务 腾讯 短信服务验证服务已经不是什么新鲜事了,但是免费的手机短信服务却不多见,本次利用Python3.0基于Twilio和腾讯云服务分别来体验一下国际短信和国内短信接口。 首先,注册Twilio: https://www.twilio.com/ 注册成功后,获取ACCOUNT SID和AUTH TOKEN,一会要用到 安装依赖的库pip3 install twi......了解更多
关于又拍云免费cdn全网加速服务的长期评测(各种踩坑)by Liu Yue/2020-01-26 标签: 关于 各种 服务 拍云 cdn 全网 评测 免费 加速 长期 之前一篇文章阐述了如何在前端进行网站优化:具体谈谈如何优化前端性能的总结,其中一条重要的优化手段是cdn加速,所谓cdn加速就是采用更多的缓存服务器(CDN边缘节点),布放在用户访问相对集中的地区或网络中。当用户访问网站时,利用全局负载技术,将用户的访问指向距离最近的缓存服务器上,由缓存服务器响应用户请求 在写那篇文章的时候,我本人还未实际使用过cdn加速,也......了解更多