Diffutoon Diffutoon 是一种基于扩散模型的高分辨率可编辑卡通着色技术,其核心功能是将真实视频转换为动漫风格,同时保持内容的一致性和高质量。 01330 AI工具集项目框架# Diffutoon# 项目框架
AniPortrait AniPortrait 是腾讯游戏智迹团队开发的一款创新的音频驱动肖像动画生成框架,能够通过音频和参考肖像图像生成高质量的动态视频。 0570 AI工具集项目框架# AniPortrait# 项目框架
DreamTalk DreamTalk是一个基于扩散模型的音频驱动表达性头部生成框架,核心功能是将静态人物照片转化为逼真、富有表现力的说话视频。 0600 AI工具集项目框架# DreamTalk# 项目框架
EmotiVoice易魔声 EmotiVoice是一个强大的开源TTS引擎,完全免费,支持中英文双语,包含2000多种不同的音色,以及特色的情感合成功能,支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。 05370 AI工具集项目框架# EmotiVoice# 易魔声# 项目框架
coze-studio Coze Studio 是由字节跳动开发并开源的一站式 AI Agent 开发工具,旨在为开发者提供从开发到部署的全方位支持,帮助他们快速构建和调试智能体、应用和工作流 。 0120 AI工具集项目框架# coze-studio# 项目框架
小智 AI 聊天机器人 小智 AI 聊天机器人是一款基于开源硬件和开源软件的智能对话设备,旨在帮助用户入门 AI 硬件开发和 AI 模型应用。 0130 AI工具集项目框架# 小智 AI 聊天机器人# 小智AI# 聊天机器人
PaddleSpeech 百度飞桨(PaddlePaddle)平台上的一个开源语音处理工具包,旨在为语音识别、语音合成、语音翻译、语音识别、语音分类、语音标点恢复、语音情感分析等任务提供全面的解决方案。 070 AI工具集项目框架# PaddleSpeech# 百度# 百度飞桨
GPT-SoVITS GPT-SoVITS 是一款创新的开源声音克隆工具,它将 GPT 模型与 SoVITS 技术相结合,能够在样本数据极少的情况下,实现高质量的语音克隆和文本到语音转换(TTS)。 070 AI工具集项目框架# GPT-SoVITS# 项目框架
Edge-TTS Edge-TTS 是一个基于微软 Azure 文本转语音(TTS)功能的 Python 库,旨在为开发者提供简单、高效、免费的文本转语音解决方案。 080 AI工具集项目框架# Edge-TTS# 项目框架
Fish Speech Fish Speech 是一个由 Fish Audio 团队开发的文本转语音(TTS)技术,旨在利用先进的机器学习和深度学习技术将文字转换为自然流畅的语音输出。 0110 AI工具集项目框架# Fish Speech# 项目框架
Xinference Xinference 是一个功能强大且功能全面的分布式推理框架,旨在简化大语言模型(LLM)、语音识别、多模态模型等多种AI模型的推理任务。 070 AI工具集项目框架# Xinference# 项目框架