Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Azure的语言合成在重复播放相同的文本时,每次的响应速度太慢,希望采用缓存机制 #526

Open
CHExN opened this issue May 5, 2023 · 0 comments
Labels
enhancement New feature or request

Comments

@CHExN
Copy link

CHExN commented May 5, 2023

有些人用 Bob 其实是想更方便的练习口语,需要重复的点击播放按钮,听语音。系统内置的语言合成服务太拉了,所以转用了发音更精准的第三方语音合成服务。

我使用的是 Azure,即使选择了东亚地区,接口的响应速度还是不太理想,大概在 400~900 ms 之间(响应速度受网络与字节数量所影响)还无法达到无感知的 200 ms 以内。所以每次重复点击播放按钮时,总觉得卡卡的。

所以我希望可以改善一下这一点,这是我的些建议:在使用非离线的语音合成时,把最新的播放的语音缓存起来,监测再次点击播放按钮,当前所要传输的文本和缓存音频对应的文本相同,则直接使用缓存中的语音。

@CHExN CHExN added the enhancement New feature or request label May 5, 2023
@CHExN CHExN changed the title 非离线的语言合成在播放相同的文本时,希望不要再重复地去请求,而是采用缓存的机制 Azure的语言合成在重复播放相同的文本时,每次的响应速度太慢,希望采用缓存机制 May 5, 2023
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
enhancement New feature or request
Projects
None yet
Development

No branches or pull requests

1 participant