写作绅士,读作丧尸 X岛揭示板
顺猴者昌 逆猴者亡 首页版规 |用户系统 |移动客户端下载 | 丧尸路标 | | 常用图串及路标 | 请关注 官方公众号:【X岛揭示板】 官方微博: 【@X岛极速版】| 人,是会思考的芦苇
常用串:·豆知识·跑团板聊天室·公告汇总串·X岛路标

No.64815525 - 无标题 - 技术宅


回应模式
No.64815525
名 称
E-mail
标题
颜文字
正文
附加图片
•程序语言、压制投稿、视频制作以及各计算机领域的技术问题
•我觉得还是CSDN靠谱一点
•本版发文间隔为15秒。

无标题 无名氏 2024-12-26(四)20:57:36 ID:hQchDty [举报] [订阅] [只看PO] No.64815525 [回应] 管理
请教一下肥哥
有没有什么免费的、不联网的语音转文字软件,准确度不用高,因为需要处理的音频很干净且标准。
首先排除whisper和基于whisper的软件,使用large-v3和v3turbo模型处理我的音频都会出现问题,具体来说,我的音频中存在'Question:…'这样的语音,输出的内容会在question后面多上一些answer或者什么意义不明的重复内容。
无标题 无名氏 2024-12-26(四)21:05:39 ID:EMFijL4 [举报] No.64815599 管理
正在用基于whisper的,体验真的是一言难尽,期待有肥哥来点更好用的,我这有收集的频道推送过类似的项目,你可以试试,我还没用过

https://github.com/jxlpzqc/TMSpeech
无标题 无名氏 2024-12-26(四)21:08:38 ID:hQchDty (PO主) [举报] No.64815623 管理
>>No.64815599
ok,我试试
无标题 无名氏 2024-12-26(四)21:32:04 ID:9uyitKZ [举报] No.64815868 管理
v3一直都有问题
用v2反而可能会好点(毕竟我用v2是没啥问题
无标题 无名氏 2024-12-27(五)01:28:37 ID:hQchDty (PO主) [举报] No.64817988 管理
>>No.64815868
v2也会出现试图回答问题的情况|д` )

UP主: