• Home
  • Python
  • Web Design
  • Db & SQL
  • Mac & Linux
  • Go & Ruby
  • Life & Work
  • Resume

FunAsr

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

by Liu Yue/2024-01-10
标签:   FunAsr   Whisper   中文   文字   王者   相颉   识别   语音   达摩院   阿里

    君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的FunAsr。    FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型,它具有高精度、高效率、便捷部署的优点,支持快速构建语音识别服务,最重要的是,FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能,也就是说,......

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽
了解更多

社交内容平台

著作/出版物 北京航空航天大学出版社 ISBN:9787512442436

Tornado(龙卷风)编程实战

公众号

刘悦的技术博客公众号

标签云

正在加载...

随机文章

使用python3.7和opencv4.1来实现人脸识别和人脸特征比对以及模型训练

2020-01-02

Mac os:将Homebrew的下载源换成国内镜像增加下载速度(阿里云镜像)

2020-03-08

在阿里云Centos上配置nginx+uwsgi+负载均衡配置

2019-05-17

Bert-vits2最终版Bert-vits2-2.3云端训练和推理(Colab免费GPU算力平台)

2023-12-27

登峰造极,师出造化,Pytorch人工智能AI图像增强框架ControlNet绘画实践,基于Python3.10

2023-02-26

义无反顾马督工,Bert-vits2V210复刻马督工实践(Python3.10)

2023-11-29

构建基于深度学习神经网络协同过滤模型(NCF)的视频推荐系统(Python3.10/Tensorflow2.11)

2023-03-30

十万高层齐卸甲,竟无一人有慈心。前阿里员工看阿里高管不法侵害女员工事件

2021-08-09

MaskGCT,AI语音克隆大模型本地部署(Windows11),基于Python3.11,TTS,文字转语音

2024-10-28

周而复始,往复循环,递归、尾递归算法与无限极层级结构的探究和使用(Golang1.18)

2022-12-21

Win10系统下安装编辑器之神(The God of Editor)Vim并且构建Python生态开发环境(2020年最新攻略)

2020-07-04

尝试开发微信公众号消息推送功能并且和小程序关联

2019-11-10

M1/M2系列芯片苹果MacOs系统蓝牙链接SonyPlayStation4手柄Rosetta 2转译畅玩实况足球pes2017

2022-12-01

不懂乐理,也能扒谱,基于openvpi将mp3转换为midi乐谱(Python3.10)

2023-11-15

使用Hexo建立一个轻量、简易、高逼格的博客

2019-06-25
Copyright ♥  刘悦 | RSS订阅 | 友情链接:卡瓦邦噶! | 剑二十七 | 星海智算 | 见字如面 | Jason | forecho | 完美的胖达 | SAUCERMAN | Debug客栈 | 晚晴幽草轩 | 隔叶黄鹂 | LFhacks.com | the5fire | P3TERX ZONE | UsubeniFantasy | 糊涂说

京ICP备17064481号-1