• Home
  • Python
  • Web Design
  • Db & SQL
  • Mac & Linux
  • Go & Ruby
  • Life & Work
  • Resume

转写

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

by Liu Yue/2024-01-25
标签:   Python3.10   Whisper   中文   优化   实践   对于   文本   识别   语音   转写

    阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形态可能在中文领域斗不过FunAsr,但是经过中文特殊优化的Whisper就未必了。    中文文本标注优化    Whisper经常被人诟病的一点是对中文语音转写后标点符号的支持不够完备。首先安装whisper:pip install -U openai......

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
了解更多

社交内容平台

著作/出版物 北京航空航天大学出版社 ISBN:9787512442436

Tornado(龙卷风)编程实战

公众号

刘悦的技术博客公众号

标签云

正在加载...

随机文章

基于python3.7利用Motor来异步读写Mongodb提高效率

2019-09-06

前端已死?全栈当立?取法于中,仅得其下。

2023-02-21

并发与并行,同步和异步,Go lang1.18入门精炼教程,由白丁入鸿儒,Go lang并发编程之GoroutineEP13

2022-08-19

利用Docker挂载Nginx-rtmp(服务器直播流分发)+FFmpeg(推流)+Vue.js结合Video.js(播放器流播放)来实现实时网络直播

2019-05-16

FLOAT坍塌原理及解决方案

2017-08-15

周而复始,往复循环,递归、尾递归算法与无限极层级结构的探究和使用(Golang1.18)

2022-12-21

mpvue1.0+python3.7+Django2.0.4实现微信小程序的支付功能

2019-09-15

无意苦争春,一任群芳妒!M1 Mac book(Apple Silicon)能否支撑全栈工程师的日常?(Python3/Ruby/PHP/Mysql/Redis/NPM/虚拟机/Docker)

2021-02-24

AI歌姬,C位出道,基于PaddleHub/Diffsinger实现音频歌声合成操作(Python3.10)

2023-11-14

Python3利用ffmpeg针对视频进行一些操作

2019-05-15

重新定义性价比!人工智能AI聊天ChatGPT新接口模型gpt-3.5-turbo闪电更新,成本降90%,Python3.10接入

2023-03-06

CosyVoice多语言、音色和情感控制模型,one-shot零样本语音克隆模型本地部署(Win/Mac),通义实验室开源

2024-07-07

化整为零优化重用,Go lang1.18入门精炼教程,由白丁入鸿儒,go lang函数的定义和使用EP07

2022-08-10

珠联壁合地设天造|M1 Mac os(Apple Silicon)基于vscode(arm64)配置搭建Java开发环境(集成web框架Springboot)

2021-05-20

免费背景音人声分离解决方案MVSEP-MDX23,足以和Spleeter分庭抗礼

2023-12-29
Copyright ♥  刘悦 | RSS订阅 | 友情链接:卡瓦邦噶! | 剑二十七 | 星海智算 | 见字如面 | Jason | forecho | 完美的胖达 | SAUCERMAN | Debug客栈 | 晚晴幽草轩 | 隔叶黄鹂 | LFhacks.com | the5fire | P3TERX ZONE | UsubeniFantasy | 糊涂说

京ICP备17064481号-1