-
Notifications
You must be signed in to change notification settings - Fork 201
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[BUG]无法正确读取的特定文本 & 尾音无法读完 #237
Labels
bug
Something isn't working
Comments
这种是不是你切的数据里,尾音就被切掉了? |
目前我也有这个问题,大部分语句生成正常,少部分抽卡的时候,语句在最后的尾音仓促结束,像被吞掉的感觉。 |
我也遇到了,用的是VQ-GAN生成的模型进行推理,开始十几次使用正常,生成到一定次数后,就会出现语句在最后一个字仓促结束,只说一半。 |
应该是在迭代提示长度较短,在64以内的时候最容易出现 |
遇到同样的问题,请问你是如何切的能保证尾音不被切掉?我用的 gpt sovits 提供的切割代码。 |
可以试一下slicer-gui切割语音 |
都是这样,最后一个字偶尔会被吞掉,可以多训练lora来merge |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Describe the bug
1.在WEB界面测试中,无论是使用参卡音频还是随即说话人,都无法正确读取文本“123456789ABCDEFG”。
2.在WEB界面测试中,生成的尾音,最后一个字无法读完.往往是在一半就停止了
To Reproduce
1.在WEB界面中,将文本“123456789ABCDEFG”输入, 播放或听取生成的语音输出。
2.在WEB界面中,将文本 “由 Fish Audio 研发的基于 VQ-GAN 和 Llama 的多语种语音合成.”
Expected behavior
1.准确发出特定文本
2.最后一个音读完
Screenshots / log
无
Additional context
问题1语音: 123456789ABCDEFG
output.mp4
问题2语音:由 Fish Audio 研发的基于 VQ-GAN 和 Llama 的多语种语音合成.
output2.mp4
The text was updated successfully, but these errors were encountered: