首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· 中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
· 汉王天地大模型
· 阿里Qwen3系列模型惊艳亮相
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· LlamaIndex的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
· AIChatru.ru
· 24年首篇离奇论文:加点噪声,RAG效果翻倍?!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 包阅AI-免费AI阅读翻译神器!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
构建开源多模态RAG系统
本质上,多模态涉及有两个输入——
音
频
和
视
觉——并产生一个单一的输出,从而实现更丰富和全面的理解。
RAG
大模型
换脸
AI换脸:FaceFusion 3.5.0更新,解决老版本无法使用问题!
ensp; · 改善唇
同
步
效果
FaceFusion
文生图
前半年,我看到的有趣的 AI 产品
很简单,00 后、10 后用户在精神方面的需求,和 70、80、90 这几代人完全不
同
。
AI工具
人工智能
深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
计算机
视
觉 计算机
视
觉是一种让计算机从数字图像或
视
频
中获取信息,并进行解析和理解的技术。
人工智能
微软
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
谷歌被逼急了,赶在年底之前仓促发布了超大模型Gemini,卷起了多模态,甚至不惜「
视
频
造假」。
小语言模型
ComfyUI
用ComfyUI整了一套照片转Q版手办的工作流
之所以要搞这个,主要是因为它跟我目前要做的很多内容都息息相关,比如2D图片转3D模型,blender的插件、图片生成
视
频
等,而且据说生成速度很快,对设备的要求低。
comfyui
文生图
大模型
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
人类获取的信息83%来自
视
觉,图文多模态大模型能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向AGI(通用人工智能)迈出更大
步
伐。
XVERSE-V
多模态大模型
数字人
数字人直播哪家强?中国数字人平台分析大全
这类软件被许多公司和个人所需,尤其是那些从事抖
音
、快手和
视
频
号等平台的公司,它们需要高质量的数字人技术来提升内容创作和用户互动体验。
数字分身
数字人
大模型
使用大模型自动回复小红书/抖
音
/快手评论:通过RAG 优化LLMs实现
LLM 的基本用法包括输入Promt并获得回复/Response RAG 通过向这个基本过程添加一
步
来实现 即,执行检索
步
骤,根据用户的提示,从外部知识库中提取相关信息,并将其注入到提示中
RAG
大模型
自动回复
ChatGPT
万字长文|40万人学习过|28个ChatGPT使用技巧,带你从入门到精通
技巧15:让ChatGPT帮你写
视
频
脚本 除了图文,你也完全可以把ChatGPT融入到你YouTube、B站或者抖
音
等
视
频
平台的创作过程中来,让ChatGPT按照你的要求写出对应
视
频
脚本。
ChatGPT
使用技巧
教程
大模型
大模型落地“诸神之战”,场景玩家先杀出重围了
它包括自然语义大模型、
视
觉大模型、
视
频
大模型,和通用大模型不
同
,它的训练数据中包含了大量成熟营销方法论、营销数据。
大模型
文生图
ComfyUI
入坑必看:comfyui界面与基础操作
让我们一
步
步
揭开comfyui的神秘面纱!
comfyui
文生图
ChatGPT
13个神级Chatgpt指令,助你小说丝滑过审
示例:原文“我喜欢听
音
乐。
ChatGPT
写作
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
与空间片段压缩类似,使用空间-时间片段压缩并设定好的卷积核参数(例如,固定的核大小、
步
长和输出通道数量)会由于
视
频
输入的特性差异,导致潜码空间维度的不
同
。
Sora
微软
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
音
频
频
谱图提供了
音
频
信号
频
谱随时间变化的直观表示。
大模型
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100