首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 「Agent」通俗易懂地聊聊AI Agent(附66个开源+44个闭源Agent项目)
· 无需翻墙,可合法使用的8款国内AI大模型产品
· 鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· AI Math Solver
· humanize.im
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
企业
大语言模型LLM和知识图谱KG
增
强
的企业搜索应用
有一连串的想象:ChatGPT 是有史以来最好的东西,是我们见过的最
强
大的人工智能,它将消除人们工作中的苦差事,让学生摆脱家庭作业。
开源模型
Stable Diffusion
读取大脑重建高清
视
频
,Stable Diffusion还能这么用
但以往的研究都主要聚焦在重建静态图像,而以高清
视
频
形式来展现的工作还是较为有限。
stablediffusion
RAG
忘掉 RAG,未来是 RAG-Fusion!搜索的下一个前沿:检索
增
强
生成遇上倒数排名融合和生成查询
可以诚实地说,最近出现的检索
增
强
生成(RAG)技术是最具颠覆性的。
RAG-Fusion
检索增强
RAG
Rerank——RAG中百尺竿头更进一步的神器,从原理到解决方案
检索
增
强
生成(RAG)是解决大语言模型(LLM)实际使用中的一套完整的技术,它可以有效解决LLM的三个主要问题:数据时效性、幻觉和数据安全问题(在我之前的文章《大模型主流应用RAG的介绍
RAG
检索增强
ComfyUI
无需编码,轻松提升图像品质:探索ComfyUI的图像
增
强
功能
无需编码,ComfyUI是一个
强
大且易于使用的解决方案,允许新用户和经验丰富的用户探索和构建复杂的StableDiffusion工作流。
文生图
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成
视
频
的方法!
之前虽然小
视
频
生成比较火,不过出的
视
频
都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
文本生成视频
AnimateDiff
工具
再次重点介绍!!!这款国内的AI制作
视
频
工具
之前介绍过一款图片生成
视
频
的工具-Flow Photo,99%的人不知道的一款国内的AI制作
视
频
工具。
Flow
Photo
视频
微调
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类
视
频
南加州大学&字节提出MagicPose,一种新颖有效的方法,提供逼真的人类
视
频
生成,实现生动的运动和面部表情传输,以及不需要任何微调的一致的野外零镜头生成。
MagicPose
视频
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或生成音
频
、
视
频
和数据流。
voice
agent
开源
音视频
教程
用AI做郭德纲说英文相声的爆款
视
频
(详细教程)
郭德纲用英文说相声的短
视
频
火爆全网,单条
视
频
点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把
视
频
翻译成30+种语言,丝滑程度,随时能把生意做到全世界
视频
翻译
语言
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
“
视
频
版ControlNet”来了!
ControlNet
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/文本
跨模态交互数据 为了
增
强
模型跨模态交互能力,作者合成了一系列
视
觉-音
频
-文本跨模态交互数据,包括图像-音
频
-文本和
视
频
-音
频
-文本数据集。
Baichuan-Omni
多模态大模型
RAG
一文看懂RAG:大语言模型落地应用的未来
以下是高级RAG的一些关键特点和创新: 多模态支持:高级RAG不仅限于文本数据,还可以处理多模态数据,例如图像、音
频
和
视
频
。
rag
检索增强
Roop参数说明,ROOP->StyleGAN演示!
1.人脸
增
强
(enhance) 人脸
增
强
,也叫人脸修复。
视频
StyleGAN
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100