Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

New feature: Text-to-speech in cherugo #59

Open
zzbslayer opened this issue May 7, 2020 · 2 comments
Open

New feature: Text-to-speech in cherugo #59

zzbslayer opened this issue May 7, 2020 · 2 comments
Labels
good first issue Good for newcomers

Comments

@zzbslayer
Copy link

最近更新了切噜语功能,然后我群群友跟我提了需求,说希望把切噜语语音发出来。感觉做出来也挺有意思的。
初步思路就是用阿里/百度 API 生成语音,然后使用 MessageSegment.record 生成 coolq 语音消息。最后加几个语音功能的配置项。

我最近忙暂时不打算做这个功能,反正issue就先开在这。

@Ice9Coffee Ice9Coffee added the good first issue Good for newcomers label May 8, 2020
@Ice9Coffee
Copy link
Owner

想法不错,但有几个问题:

  1. docker内部署的酷q似乎要安装别的组件才能发语音
  2. 需要api key
  3. 更多的网络请求可能会降低性能
  4. 需要更多的存储空间(本身发图就已经占有很多存储了)
  5. Last but not least, 谷歌娘/度娘/阿里娘的声优不是佐仓

欢迎pr

@zzbslayer
Copy link
Author

zzbslayer commented May 10, 2020

  1. 这个就得花时间稍微研究一下了。没有办法……
  2. api key 反正大家有需要的自己申请。如果有佐仓语音素材的话倒是不需要api key了,见5
  3. 那没有办法。要是性能实在太差了,可以把这个功能关了(
    讲点题外话,之前听你讲 nonebot 是一个单线程异步模型,在一般情况下,他的 latency 是要比传统多线程模型高的。如果 nonebot 层面能够配置线程池,多几个线程来处理,理论上能够降低 latency。
  4. 我觉得存储空间问题不大,语音毕竟只是一次性发送,定时清理语音缓存即可。
  5. 要是有佐仓语音素材的话,自己合成也未尝不可… 大概唯一的问题就是要学习一些语音文件的处理。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
good first issue Good for newcomers
Projects
None yet
Development

No branches or pull requests

2 participants