首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用ChatGPT润色出高品质文章!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
· 从零开始了解AI大模型 - 概念篇:一文带你走进大模型世界
· 大模型量化:什么是模型量化,如何进行模型量化
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Agent
用了一个月,终于找到点写 AI Agent 的思路
不断尝试落地 AI 应用端不断尝试落地 AI 应用端 基于对运维的认知,我开发了一个开源的运维
工
具
https://github.com/shaowenchen/ops 。
AI
Agent
Ops
运维工具
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
字节跳动最近推出了一款名为PersonaTalk的AI模型,这项黑科技让视
频
配
音
彻底摆脱了传统的“僵硬感”。
PersonaTalk
视频
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI
工
具
都能直接用,UI简直是视觉盛宴!
它开源的
工
具
,UI一样很酷,当然,功能也真的很强,46.6k的星星绝不是虚名。
AI开源
集合
DeepMusic发布“和弦派”2.0:重塑AI
音
乐创作范式,赋予创作者全方位掌控
4月29日,国内领先的人
工
智能
音
乐服务商DeepMusic,发布了自主研发的AI
音
乐
工
作站——“和弦派”2.0正式版。
和弦派
DeepMusic
音乐创作
大模型
视
频
大模型训练相关词条解释
Sora是OpenAI公司发布的一款AI视
频
生成模型。
视频生成
sora
词条
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短视
频
火爆全网,同类型的AI短视
频
层出不穷,更有好莱坞明星说中文的短视
频
,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视
频
吧!
数字人
音视频
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
音
频
克隆的开源项目很多,但是每次项目里要用的时候,总还是惦记着11labs的api。
F5-TTS
音频克隆
鹅厂最新AI
工
具
刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
前脚字节阿里的
工
具
火了,现在腾讯这个新照片生成应用PhotoMaker直接刷屏,瞧这阵仗…… 只需上传一张或以上照片,无需额外LoRA训练,就能快速可定制。
PhotoMaker
图生图
开源
有感情的语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的语
音
生成模型,专门用于大型语言模型(LLM)助手的对话任务、对话语
音
和视
频
介绍等应用。
ChatTTS
语音合成
开源
【开源项目】Flow Matching 语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语
音
合成领域,下面是voicebox的一个
工
作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
字正腔圆,万国同
音
,coqui-ai TTS跨语种语
音
克隆,钢铁侠讲16国语言
按照固有的思维方式,如果想要语
音
克隆首先得有克隆对象
具
体的语言语
音
样本,换句话说,克隆对象必须说过某一种语言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨语种无需训练的语
音
克隆技术
coqui-ai
TTS
语音
Stable Diffusion
[Stable Diffusion]AnimateDiff :最稳定的文本生成视
频
插件
在小视
频
风靡的时代,稳定的文本生成短视
频
成为了迫切需求。
AnimateDiff
视频
训练
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
WebUI
工
具
: 集成
工
具
包括声
音
伴奏分离、自动训练集分割、中文自动语
音
识别(ASR)和文本标注,协助初学者创建训练数据集和
数字人
声音克隆
GPT-SoVITS
国内厂商语
音
识别与Whisper评测:现状与概况对比
随着人
工
智能技术的飞速发展,语
音
识别已经成为了现代社会中一个重要的研究领域。
语音识别
Faster-Whisper
Stable Diffusion
Stable Diffusion AnimateDiff | 最火文本生成视
频
插件
AnimateDiff介绍 AnimateDiff采用控制模块来影响Stable Diffusion模型,通过大量短视
频
剪辑的训练,它能够调整图像生成过程,生成一系列与训练视
频
剪辑相似的图像。
动画
视频
AnimateDiff
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100