首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 高效选择:Ollama与LM Studio深度对比
· GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
· 使用ChatGPT润色出高品质文章!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· LLM应用架构之检索增强(RAG)的缘起与架构介绍
· Stable Diffusion 加速/优化/升级 优化出图速度
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
· 一个完整Prompt让ChatGPT自动生成短视频制作脚本
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
企业
大语言模型LLM和知识图谱KG
增
强
的企业搜索应用
有一连串的想象:ChatGPT 是有史以来最好的东西,是我们见过的最
强
大的人工智能,它将消除人们工作中的苦差事,让学生摆脱家庭作业。
开源模型
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和
视
频
焕发新生!
AnyText 我之前也写文章介绍过了,专门针对中文,在生成的图片中能够很好的嵌入中文,而且还有
强
大的文字编辑功能。
阿里云
视频
音频
RAG
忘掉 RAG,未来是 RAG-Fusion!搜索的下一个前沿:检索
增
强
生成遇上倒数排名融合和生成查询
可以诚实地说,最近出现的检索
增
强
生成(RAG)技术是最具颠覆性的。
RAG-Fusion
检索增强
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法!
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
工具
再次重点介绍!!!这款国内的AI制作
视
频
工具
之前介绍过一款图片生成
视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作
视
频
工具。
Flow
Photo
视频
RAG
Rerank——RAG中百尺竿头更进一步的神器,从原理到解决方案
检索
增
强
生成(RAG)是解决大语言模型(LLM)实际使用中的一套完整的技术,它可以有效解决LLM的三个主要问题:数据时效性、幻觉和数据安全问题(在我之前的文章《大模型主流应用RAG的介绍
RAG
检索增强
ComfyUI
无需编码,轻松提升图像品质:探索ComfyUI的图像
增
强
功能
无需编码,ComfyUI是一个
强
大且易于使用的解决方案,允许新用户和经验丰富的用户探索和构建复杂的StableDiffusion工作流。
文生图
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
教程
用AI做郭德纲说英文相声的爆款
视
频
(详细教程)
郭德纲用英文说相声的短
视
频
火爆全网,单条
视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/文本
跨模态交互数据 为了
增
强
模型跨模态交互能力,作者合成了一系列
视
觉-音
频
-文本跨模态交互数据,包括图像-音
频
-文本和
视
频
-音
频
-文本数据集。
Baichuan-Omni
多模态大模型
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频
版ControlNet”来了!
ControlNet
RAG
一文看懂RAG:大语言模型落地应用的未来
以下是高级RAG的一些关键特点和创新: 多模态支持:高级RAG不仅限于文本数据,还可以处理多模态数据,例如图像、音
频
和
视
频
。
rag
检索增强
Roop参数说明,ROOP->StyleGAN演示!
1.人脸
增
强
(enhance) 人脸
增
强
,也叫人脸修复。
视频
StyleGAN
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100