刘悦_刘悦的技术博客_LiuYue's Tech Blog

一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed)

by Liu Yue/2023-11-16

标签: Embed Python3.10 一键万灵万用制作嵌入式整合项目

我们知道Python是一门解释型语言，项目运行时需要依赖Python解释器，并且有时候需要安装项目中对应的三方依赖库。对于专业的Python开发者来说，可以直接通过pip命令进行安装即可。但是如果是分发给其他的Windows用户，特别是不熟悉Python的人来说，这样过于繁琐。因此最好的办法是连同Python解释器和Python项目打包在一起，通过嵌入式一键整合包解决项目的分发问题。本次我们以一键扒谱的项目为例子，演示如何将项目直接打包为一......

一键整合,万用万灵,Python3.10项目嵌入式一键整合包的制作(Embed)

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

by Liu Yue/2023-11-15

标签: midi mp3 openvpi Python3.10 乐理乐谱基于转换

所谓"扒谱"是指通过听歌或观看演奏视频等方式，逐步分析和还原音乐作品的曲谱或乐谱的过程。它是音乐学习和演奏的一种常见方法，通常由音乐爱好者、乐手或学生使用。在扒谱的过程中，人们会仔细聆听音乐作品，辨别和记录出各个音符、和弦、节奏等元素，并通过试错和反复推敲来逐渐还原出准确的曲谱或乐谱。这对于那些没有正式乐谱或想学习特定曲目的人来说，是一种有效的方式。扒谱的目的是为了更好地理......

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

by Liu Yue/2023-11-14

标签: ai Diffsinger PaddleHub Python3.10 位出合成基于实现操作歌声歌姬音频

懂乐理的音乐专业人士可以通过写乐谱并通过乐器演奏来展示他们的音乐创意和构思，但不识谱的素人如果也想跨界玩儿音乐，那么门槛儿就有点高了。但随着人工智能技术的快速迭代，现在任何一个人都可以成为“创作型歌手”，即自主创作并且让AI进行演唱，极大地降低了音乐制作的门槛。本次我们基于PaddleHub和Diffsinger实现音频歌声合成操作，魔改歌曲《学猫叫》。配置PaddleHub 首先确保本......

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

春秋笔法,微言大义,中山二院“癌症事件”情况说明解析

by Liu Yue/2023-11-09

标签: 中山事件二院微言大义情况春秋笔法癌症解析说明

公元2023年11月8日凌晨2点20分，广州的中山医科大学孙逸仙纪念医院发布关于“癌症事件”的情况说明：第一段：我院关注到网络上有传播“中山二院乳腺外科团队疑受实验环境和试剂影响致多人患癌”等信息。医院迅速组织调查核实，初步了解到：近年在乳腺肿瘤中心实验室工作、学习过的人员中有3名罹患癌症，其中2名现为我院乳腺外科医生，在临床工作；另外1名不是我院职工或学生，为外地来院进修人员，已回原单位工作。该实验室无在读学生患癌。 &nbs......

春秋笔法,微言大义,中山二院“癌症事件”情况说明解析

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

by Liu Yue/2023-11-03

标签: Faster Python3.10 Whisper 双语字幕实践快速持续视频转录进化进行

Faster-Whisper是Whisper开源后的第三方进化版本，它对原始的 Whisper 模型结构进行了改进和优化。这包括减少模型的层数、减少参数量、简化模型结构等，从而减少了计算量和内存消耗，提高了推理速度，与此同时，Faster-Whisper也改进了推理算法、优化计算过程、减少冗余计算等，用以提高模型的运行效率。本次我们利用Faster-Whisper对日语视频进行双语(日语/国语)转录实践，看看效率如何。 &nbs......

持续进化，快速转录，Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

by Liu Yue/2023-10-23

标签: Bert Python3.10 vits2 克隆实践打造文字栩栩如生视频语音音色鬼畜

诸公可知目前最牛逼的TTS免费开源项目是哪一个？没错，是Bert-vits2，没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型，基本上解决了VITS的语气韵律问题，在效果非常出色的情况下训练的成本开销普通人也完全可以接受。 BERT的核心思想是通过在大规模文本语料上进行无监督预训练，学习到通用的语言表示，然后将这些表示用于下游任务的微调。相比传统的基于词嵌入的模型，BERT引入了双向上下文信息的建模，使得模型能够更好地理解......

栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践(Python3.10)

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

by Liu Yue/2023-10-13

标签: ai ProPainter Python3.10 不施人工智能以及去除图片基于技术水印洗尽粉黛视频铅华

视频以及图片修复技术是一项具有挑战性的AI视觉任务，它涉及在视频或者图片序列中填补缺失或损坏的区域，同时保持空间和时间的连贯性。该技术在视频补全、对象移除、视频恢复等领域有广泛应用。近年来，两种突出的方案在视频修复中崭露头角：flow-based propagation和spatiotemporal Transformers。尽管两套方案都还不错，但它们也存在一些局限性，如空间错位、时间范围有限和过高的成本。说白了，你通过AI技术移除水印或......

铅华洗尽,粉黛不施,人工智能AI基于ProPainter技术去除图片以及视频水印(Python3.10)

AIGC革新，将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

by Liu Yue/2023-10-07

标签: ai AIGC labs Logo PIKA Python3.10 基于或者文字融入视频革新

很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图，这样可以有效的防止用户的一些“导流”行为。当然，头像、文章或者视频现在都是AI来审，毕竟现在人工的成本实在太高，但是如果我们把文字元素直接融入图像或者视频之中，如此一来，AI也会很难识别出一些“导流”的元素。本次我们依靠PIKA-labs平台，无需本地环境，直接简单粗暴输出带有文字元素的光影视频效果，基于Python3.10。文字/图片生成视频&nbs......

AIGC革新，将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)

《卖炭翁》致敬河北程序员，初读已解诗中意，再读却是诗中人！

by Liu Yue/2023-10-02

标签: 中意初读卖炭翁却是已解河北程序员致敬诗中人

起初他们追杀共产主义者的时候，我没有说话——因为我不是共产主义者；接着他们追杀犹太人的时候，我没有说话——因为我不是犹太人；后来他们追杀工会成员的时候，我没有说话——因为我不是工会成员；此后他们追杀天主教徒的时候，我没有说话——因为我是新教教徒；最后他们奔我而来，那时已经没有人能为我说话了。这一首著名的《我没有说话》是德国神学家马丁・尼莫拉牧师的忏悔诗，尽管他写的是自己，但这首诗却振聋发聩，发人深省，其描述忽视与表面上自己无关的团体所造成的结果。该诗后来常被引用，作为......

《卖炭翁》致敬河北程序员，初读已解诗中意，再读却是诗中人！

基于TOTP算法的Github两步验证2FA(双因子)机制Python3.10/Golang1.21实现

by Liu Yue/2023-09-29

标签: 2FA github Golang1.21 Python3.10 TOTP 两步因子基于实现机制算法验证

从今年(2023)三月份开始，Github开始强制用户开启两步验证2FA(双因子)登录验证，毫无疑问，是出于安全层面的考虑，毕竟Github账号一旦被盗，所有代码仓库都会毁于一旦，关于双因子登录的必要性请参见：别让你的服务器(vps)沦为肉鸡(ssh暴力破解)，密钥验证、双向因子登录值得拥有。双因子登录说白了就是通过第三方设备证明"你是你自己"的一个措施，Github官方推荐在移动端下载1Password、Authy、M......

基于TOTP算法的Github两步验证2FA(双因子)机制Python3.10/Golang1.21实现

通用密钥,无需密码,在无密码元年实现Passkeys通用密钥登录(基于Django4.2/Python3.10)

by Liu Yue/2023-06-21

标签: Django4.2 Passkeys Python3.10 元年基于实现密码密钥无需登录通用

毋庸讳言，密码是极其伟大的发明，但拜病毒和黑客所赐，一旦密码泄露，我们就得绞尽脑汁再想另外一个密码，但记忆力并不是一个靠谱的东西，一旦遗忘密码，也会造成严重的后果，2023年业界巨头Google已经率先支持了Passkeys登录方式，只须在设备上利用PIN码解锁、指纹或面部辨识等生物识别方式，即可验证身份，也就是说，可以和密码说拜拜了。什么是PassKeys Passkeys的原理很简单，就是在用户注册环节，可以选......

通用密钥,无需密码,在无密码元年实现Passkeys通用密钥登录(基于Django4.2/Python3.10)

批量生成,本地推理，人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

by Liu Yue/2023-06-15

标签: PaddleSpeech Python3.10 人工智能克隆声音实践批量推理本地框架生成

云端炼丹固然是极好的，但不能否认的是，成本要比本地高得多，同时考虑到深度学习的训练相对于推理来说成本也更高，这主要是因为它需要大量的数据、计算资源和时间等资源，并且对超参数的调整也要求较高，更适合在云端进行。在推理阶段，模型的权重和参数不再调整。相反，模型根据输入数据的特征进行计算，并输出预测结果。推理阶段通常需要较少的计算资源和时间，所以训练我们可以放在云端，而批量推理环节完全可以挪到本地，这样更适合批量的声音克隆场景。 &n......

批量生成,本地推理，人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

by Liu Yue/2023-06-14

标签: ai PaddleSpeech Python3.10 一镜人工智能克隆到底国师基于声音打造精致细腻视频鬼畜

电影《满江红》上映之后，国师的一段采访视频火了，被无数段子手恶搞做成鬼畜视频，诚然，国师的这段采访文本相当经典，他生动地描述了一个牛逼吹完，大家都信了，结果发现自己没办法完成最后放弃，随后疯狂往回找补的过程。最离谱的是，他这段采访用极其丰富的细节描述了一个没有发生且没有任何意义的事情，堪比单口相声，形成了一种荒诞的美感，毫无疑问，《满江红》最大的贡献就是这个采访素材了。往这个文本里套内容并没有什么难度，小学生也可......

声音克隆,精致细腻,人工智能AI打造国师“一镜到底”鬼畜视频,基于PaddleSpeech(Python3.10)

南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)

by Liu Yue/2023-06-07

标签: ai Python3.10 Sadtalker 南洋回应基于孙燕姿德艺双馨才女本尊

孙燕姿果然不愧是孙燕姿，不愧为南洋理工大学的高材生，近日她在个人官方媒体博客上写了一篇英文版的长文，正式回应现在满城风雨的“AI孙燕姿”现象，流行天后展示了超人一等的智识水平，行文优美，绵恒隽永，对AIGC艺术表现得极其克制，又相当宽容，充满了语言上的古典之美，表现出了“任彼如泰山压顶，我只当清风拂面”的博大胸怀。本次我们利用edge-tts和Sadtalker库让AI孙燕姿朗诵本尊的博文，让流行天后念给你听。 S......

南洋才女,德艺双馨,孙燕姿本尊回应AI孙燕姿(基于Sadtalker/Python3.10)

音容笑貌,两臻佳妙,人工智能AI换脸(deepfake)技术复刻《卡萨布兰卡》名场面(Python3.10)

by Liu Yue/2023-05-23

标签: ai deepfake Python3.10 两臻人工智能佳妙卡萨布兰卡场面复刻技术换脸音容笑貌

影史经典《卡萨布兰卡》是大家耳熟能详的传世名作，那一首壮怀激烈，激奋昂扬的马赛曲，应当是通片最为激动人心的经典桥段了，本次我们基于faceswap和so-vits库让AI川普复刻美国演员保罗·亨雷德高唱《马赛曲》的名场面。配置人脸替换DeepFakes项目关于人脸替换，业内鼎鼎有名的deepfakes代表了这个人工智能细分领域的最高水平，旗下的faceswap库正好适合这种视频二次创作的场景。 &nb......

音容笑貌,两臻佳妙,人工智能AI换脸(deepfake)技术复刻《卡萨布兰卡》名场面(Python3.10)

声音好听,颜值能打,基于PaddleGAN给人工智能AI语音模型配上动态画面(Python3.10)

by Liu Yue/2023-05-18

标签: ai PaddleGAN Python3.10 人工智能动态基于声音好听模型画面语音颜值

借助So-vits我们可以自己训练五花八门的音色模型，然后复刻想要欣赏的任意歌曲，实现点歌自由，但有时候却又总觉得少了点什么，没错，缺少了画面，只闻其声，却不见其人，本次我们让AI川普的歌声和他伟岸的形象同时出现，基于PaddleGAN构建“靓声靓影”的“懂王”。 PaddlePaddle是百度开源的深度学习框架，其功能包罗万象，总计覆盖文本、图像、视频三大领域40个模型，可谓是在深度学习领域无所不窥。 Paddle......

声音好听,颜值能打,基于PaddleGAN给人工智能AI语音模型配上动态画面(Python3.10)

云端炼丹,算力白嫖,基于云端GPU(Colab)使用So-vits库制作AI特朗普演唱《国际歌》

by Liu Yue/2023-05-16

标签: ai Colab GPU so vits 云端使用制作国际歌基于演唱炼丹特朗普算力

人工智能AI技术早已深入到人们生活的每一个角落，君不见AI孙燕姿的歌声此起彼伏，不绝于耳，但并不是每个人都拥有一块N卡，没有GPU的日子总是不好过的，但是没关系，山人有妙计，本次我们基于Google的Colab免费云端服务器来搭建深度学习环境，制作AI特朗普，让他高唱《国际歌》。 Colab（全名Colaboratory ），它是Google公司的一款基于云端的基础免费服务器产品，可以在B端，也就是浏览器里面编写和执行Python代码，非常方......

云端炼丹,算力白嫖,基于云端GPU(Colab)使用So-vits库制作AI特朗普演唱《国际歌》

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

by Liu Yue/2023-05-12

标签: ai Python3.10 so vits 人工智能叶蓓基于女神模型民谣流行自己训练音色

流行天后孙燕姿的音色固然是极好的，但是目前全网都是她的声音复刻，听多了难免会有些审美疲劳，在网络上检索了一圈，还没有发现民谣歌手的音色模型，人就是这样，得不到的永远在骚动，本次我们自己构建训练集，来打造自己的音色模型，让民谣女神来唱流行歌曲，要多带劲就有多带劲。构建训练集训练集是指用于训练神经网络模型的数据集合。这个数据集通常由大量的输入和对应的输出组成，神经网络模型通过学习输入和输出之间的关系来进行训练，并且在......

民谣女神唱流行，基于AI人工智能so-vits库训练自己的音色模型(叶蓓/Python3.10)

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

by Liu Yue/2023-05-11

标签: ai Python3.10 人工智能原唱在线复刻天后孙燕姿实践应用晴子模型遥远飙歌

忽如一夜春风来，亚洲天后孙燕姿独特而柔美的音色再度响彻华语乐坛，只不过这一次，不是因为她出了新专辑，而是人工智能AI技术对于孙燕姿音色的完美复刻，以大江灌浪之势对华语歌坛诸多经典作品进行了翻唱，还原度令人咋舌，如何做到的? 本次我们借助基于Python3.10的开源库so-vits-svc，让亚洲天后孙燕姿帮我们免费演唱喜欢的歌曲，实现点歌自由。 so-vits-svc是基于VITS的开源项目，VITS（Variat......

AI天后,在线飙歌,人工智能AI孙燕姿模型应用实践，复刻《遥远的歌》，原唱晴子(Python3.10)

Python3.10动态修改Windows系统(win10/win11)本地IP地址(静态IP)

by Liu Yue/2023-05-09

标签: IP IP地址 Python3.10 win10 Win11 Windows 修改动态本地系统静态

一般情况下，局域网里的终端比如本地服务器设置静态IP的好处是可以有效减少网络连接时间，原因是过程中省略了每次联网后从DHCP服务器获取IP地址的流程，缺点是容易引发IP地址的冲突，当然，还有操作层面的繁琐，如果想要切换静态IP地址，就得去网络连接设置中手动操作，本次我们使用Python3.10动态地修改电脑的静态IP地址。获取多网卡配置一个网卡对应一个静态IP地址，但机器上未必只有一个网卡，所以如果想动态切换，必......

Python3.10动态修改Windows系统(win10/win11)本地IP地址(静态IP)

上一页 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 下一页