首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· 中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
· 汉王天地大模型
· 阿里Qwen3系列模型惊艳亮相
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· LlamaIndex的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
· AIChatru.ru
· 24年首篇离奇论文:加点噪声,RAG效果翻倍?!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 包阅AI-免费AI阅读翻译神器!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
国内厂商语
音
识别与Whisper评测:现状与概况对比
同
时,Whisper(飞思卡尔语
音
识别技术)作为一项国际上也备受关注的语
音
识别技术,在语
音
识别领域也有着广泛的应用。
语音识别
Faster-Whisper
开源
有道开源的国产语
音
库EmotiVoice爆火了!具有情绪控制功能的语
音
合成引擎!
接下面让我们看看这款国产语
音
库为何如何迅速的火遍大江南北的🔥!
EmotiVoice
语音库
借题发挥下最近几例声
音
克隆的应用案例
通过训练儿子过去的
视
频
,可以让AI让儿子的形象再现。
声音克隆
数字人
ChatGPT
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
计算机
视
觉识别模块支持离线运行。
ai小车
esp32
开源
换脸
除了深度换脸、模拟配
音
,还能口型匹配的AI软件出现了
过去,许多企业需要聘请多个
视
频
主持人用不
同
的语言表达
同
一个故事,而现在,他们可以通过生成式AI来实现
同
样的功能。
AI
开发语
音
产品时设计唤醒词和命令词的技巧
在实际开发语
音
产品过程中,要达到好的语
音
识别效果,除了语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
大模型
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
8月25日消息,阿里云推出大规模
视
觉语言模型Qwen-VL,一
步
到位、直接开源。
大模型
Stable Diffusion
小白设计师福
音
:Stable Diffusion 16款插件测评,好用不?推荐吗?
:⭐️ 能做什么:Segment Anything 是一款强大的图像分割工具,可用于自动识别和分割图像中的不
同
对象。
SD
插件
文生图
Stable Diffusion
Stable Diffusion|儿童绘本全流程制作分享
上次分享了一个将小说转化为
视
频
的全过程的教程。
StableDiffusion
绘本
懒人福
音
!用AI生成会议纪要,让你的工作更高效!
通义听悟主要聚焦于
音
视
频
内容,提供多种功能,包括实时语
音
转写、
音
视
频
文件转写、实时翻译、内容标记和智能全文概要等。
会议纪要
AI工具
工具
惊艳推荐!8款好用又免费的文本转语
音
TTS工具
随着人工智能(AI)技术的进
步
,基于AI的TTS技术已经成为了新的标准。
TTS
Maker
语音
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
今天介绍一个开源的完整的数字人项目:Fay Fay是一个完整的开源项目,包含Fay控制器及数字人模型,可灵活组合出不
同
的应用场景:虚拟主播、现场推销货、商品导购、语
音
助理、远程语
音
助理、数字人互动、心理测评
Fay
开源项目
数字人
Transformer
ViTPose+:迈向通用身体姿态估计的
视
觉Transformer基础模型
ViTPose+进一
步
拓展到多种不
同
类型的身体姿态估计任务,涵盖动物、人体以及典型的身体骨骼、手、脚、脸部等关键点类型,在不增加推理阶段模型复杂度和计算复杂度的情况下,实现了多个数据集上的最佳性能。
ViTPose+
Transformer
身体姿态
换脸
AI 换脸——Deepfacelab 下载与安装,新手教程
AI 换脸越来越火,换脸的
视
频
到处都是,那种还是那种的都有。
Deepfacelab
换脸
大模型
全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一
据介绍,与目前市面上的主流
视
频
生成算法不
同
,EMO的原理是用
音
频
驱动图片的人像,使其做出与
音
频
内容高度匹配的口型和表情。
EMO
阿里
全民演唱
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100