Emu Video Emu Video 是由 Meta 开发的先进文本生成视频工具,采用因子化生成方法,通过两个扩散模型实现高质量视频生成。用户只需输入文本提示,即可生成分辨率高达 512x512 像素、每秒 16 ...
pyvideotrans pyvideotrans是一个开源的视频翻译配音工具(开源协议GPL-v3),可将一种语言发音的视频,翻译为另一种语言发音的视频,并嵌入该语言字幕。它利用了先进的语音识别、机器翻译和语音...
fal.ai fal.ai 是一个基于人工智能在线绘图工具,它结合了先进的潜在一致性模型(LCM)和 GPT-4 API,为用户提供了一种全新的创作体验。通过简单的线条草图和自然语言描述,fal.ai 能够即...
Adobe Firefly Image2 Adobe Firefly Image 2 是Adobe推出的一款生成式人工智能模型,建立在Firefly图像模型的基础上,专为设计师和创作者提供更强大、更智能的图像生成能力。它通过简单的文字描述,可...
MuseTalk:腾讯推出的高质量音频驱动唇形同步模型 MuseTalk是由腾讯推出的一个实时的高质量音频驱动唇形同步模型,能够根据输入的音频信号自动调整数字人物的面部图像,使其唇形与音频内容高度同步,支持多种语言,并实现每秒30帧...