作者:广树时间:2023-04-19 23:44:01分类:Node.js
最近,使用了当前热门的ChatGPT创建了一个游戏直播解说程序。
这个程序是基于早年《创建一个自己的虚拟主播吧!》的代码改造而成。
我所设想的基本流程是这个样子的:
1.使用者给AI设定一个人设。
2.使用者描述一段游戏场景。
3.通过浏览器的语音识别功能将描述转变成文字。
4.描述文字合并到前面设定的人设中。
5.通过ChatGPT的API让AI根据描述解说一段游戏内容。
6.用Azure将生成的文本转换成语音。
当然,也可以根据观众的评论做出评论回复。
通过以上设置就得到了下面哔哩哔哩直播的效果
<点击进入>
直播中可以看到很多问题,如:
解说还是很生硬的,有时候甚至文不对题,哈哈哈。
虽然我的提示语句里提到了句尾加喵,但是有时候却是咕噜咕噜,或者nya,很迷。
明明说了20字内,基本都是超过20字的。
因为AI接口返回速度有时候很慢,不一定能解说节奏快的游戏。
从设定语句中可以看到,为了不让AI每次都自我介绍或者介绍游戏,加了很多限制性语句。(当然这也可能是因为出于成本考虑,没有将完整的记录上传导致的)
其实我设想的最理想状态是每隔一段时间获取OBS截图,通过图像识别接口识别图中元素并转换成文字喂给ChatGPT去解说,但是这个成本过于庞大,所以暂时就由人工手动通过语音识别去输入关键信息。
总的来说这程序还是只能算是个玩具,甚至这种解说有点脱裤子放屁的感觉,毕竟都有精力去提示关键词了,为什么不直接人工解说,哈哈哈。
github地址:<点击进入>