• Home
  • Python
  • Web Design
  • Db & SQL
  • Mac & Linux
  • Go & Ruby
  • Life & Work
  • Resume

闻其声

闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

by Liu Yue/2023-01-17
标签:   ai   CPU   cuda   M1   Mac   mps   Python3.10   Pytorch   Whisper   人工智能   基于   本地   而知   识别   语音   闻其声   雅意

    前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转回文字,所谓闻其声而知雅意。    Whisper 是一个开源的语音识别库,它是由Facebook AI Research (FAIR)开发的,支持多种语言的语音识别。它使用了双向循环神经网络(bi-directional RNNs)来识别语音并将其转......

闻其声而知雅意,M1 Mac基于PyTorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)
了解更多

社交内容平台

著作/出版物 北京航空航天大学出版社 ISBN:9787512442436

Tornado(龙卷风)编程实战

公众号

刘悦的技术博客公众号

标签云

正在加载...

随机文章

关于mysql表引擎的问题

2016-09-10

物无定味适口者珍,Python3并发场景(CPU密集/IO密集)任务的并发方式的场景抉择(多线程threading/多进程multiprocessing/协程asyncio)

2022-08-01

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

2023-11-14

搞清楚系统到底怎样支撑高并发以及架构图的绘制(面试向)

2019-07-02

基于Vue.js2.6结合h5来实现视频播放画中画技术(Picture-in-Picture)

2019-12-25

使用python将word文档和pdf电子书进行格式互转(兼容Windows/Linux)

2019-07-10

千姿百态,瞬息万变,Win11系统NeoVim打造全能/全栈编辑器(前端/Css/Js/Vue/Golang/Ruby/ChatGpt)

2023-02-01

轻盈潇洒卓然不群,敏捷编辑器Sublime text 4中文配置Python3开发运行代码环境(Win11+M1 mac)

2022-04-01

前端已死?全栈当立?取法于中,仅得其下。

2023-02-21

防微杜渐,未雨绸缪,百度网盘(百度云盘)接口API自动化备份上传以及开源发布,基于Golang1.18

2023-01-11

持续进化,快速转录,Faster-Whisper对视频进行双语字幕转录实践(Python3.10)

2023-11-03

彻底弄清楚session,cookie,sessionStorage,localStorage的区别及应用场景(面试向)

2019-07-02

承上启下继往开来,Python3上下文管理器(ContextManagers)与With关键字的迷思

2022-07-19

《卖炭翁》致敬河北程序员,初读已解诗中意,再读却是诗中人!

2023-10-02

如何快速部署本地训练的 Bert-VITS2 语音模型到 Hugging Face

2024-01-15
Copyright ♥  刘悦 | RSS订阅 | 友情链接:卡瓦邦噶! | 剑二十七 | 星海智算 | 见字如面 | Jason | forecho | 完美的胖达 | SAUCERMAN | Debug客栈 | 晚晴幽草轩 | 隔叶黄鹂 | LFhacks.com | the5fire | P3TERX ZONE | UsubeniFantasy | 糊涂说

京ICP备17064481号-1