Realtime TTS RealtimeTTS 是一个由 Koja 8开发的实时将文本转换成语音的开源项目。该项目基于 Web 技术栈,可以在浏览器中运行,无需安装任何额外软件,只需一个可连接的麦克风,就能实现高质...
Diffutoon Diffutoon是一种先进的动漫风格渲染技术,它能够将真人视频转换成动漫风格。这个技术由阿里巴巴和华东师范大学的研究人员推出,基于扩散模型的可编辑卡通着色技术。Diffutoon具备...
VTA-LDM VTA-LDM 是由腾讯人工智能实验室开发的一个隐含对齐视频到音频生成框架。专注于从视频生成对齐的音频内容,通过隐含对齐技术,VTA-LDM 确保生成的音频在语义和时间上与视频内容完...