首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 高效选择:Ollama与LM Studio深度对比
· GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
· 使用ChatGPT润色出高品质文章!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· LLM应用架构之检索增强(RAG)的缘起与架构介绍
· Stable Diffusion 加速/优化/升级 优化出图速度
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
· 一个完整Prompt让ChatGPT自动生成短视频制作脚本
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
此外,TurtleBot3还支持语
音
识别和语
音
合成技术,可以与人进行自然语言交互,完成特定任务。
ROS
机器人
开源模型
大模型
大模型能力快速测评极简题目
猜谜语:埋在奴家心底,打一字 请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间,拉尔夫大
声
地对着自己的 iPhone 说话 请问下列哪个事件引起了另一个事件?
大模型
Agent
深度好文,Agent盛行前传
Agent试用和搭建方法 笔者在一个社群中收到的推荐,体验了一款agent生成和使用服务,MindOS,如果是自己搭建,需要选择
声
音
风格、形象等,还可以搭建自己的团队,添加市场中的其他
Agent
大模型
开源
开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI Codex
但也不乏怀疑的
声
音
,软件架构师 Mark Thompson 认为“虽然 Code Llama 的开源性质颇具吸引力,但真正的试金石仍然着落在性能和适应性方面。
开源模型
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
扩散模型通过一个数学上的可靠框架,利用 U-Net 技术将噪
声
转化为图像,这一过程中,U-Net 通过预测和减少每步的噪
声
来帮助这一转换。
Sora
微软
大模型
国内AI大模型已近80个,哪个最有前途?
就像贾里尼克几十年前说的,每开掉一个语言学家,语
音
识别率就上升了。
大模型
ComfyUI
【ComfyUI】使用ComfyUI玩SDXL的正确打开方式
确保打开,添加噪
声
。
开源模型
FaceFusion参数详解
(2.3.1)Source 指定一个或多个源图像/
音
频(
音
频用于嘴型同步) 用法: -s 或者 --source 比如: --source image1.jpg --source
FaceFusion
文生图
数字人
划重点!全网最全AI数字人工具合集!
· 选择语
音
:输入文字或录制语
音
,让数字人“说出”你想让他/她表达的内容。
AI
数字人
ComfyUI
使用ComfyUI玩SDXL的正确打开方式
确保打开,添加噪
声
。
文生图
ComfyUI
RAG
RAG模型的主要痛点和解决方案
- 设计一个验证头网络,以在生成之前明确验证
声
明。
rag
大模型
「长文」可能是目前最全的LangChain AI资源库之一
[123]•AudioGPT[124]:理解和生成语
音
、
音
乐、
声
音
和说话头像。
工作
Prompt
80多个罕见的论文prompt,让你起飞!
[在此处粘贴您的原始
声
明]。
prompt
提示词
论文
用GPT4创建一部连环画故事
被外面的笑
声
吸引,男孩暂停了,智能手机被留在一旁,他对门外的生动世界感到好奇。
GPT4
连环画故事书
大模型
百川智能RAG方案总结:搜索出生的百川智能大模型RAG爬坑之路
用户输入变复杂:与传统关键词或者短语搜索逻辑不太一致,用户输入问题不再是词或者短句,而是转变成自然对话
声
知识多轮对话数据,问题形式更加多元,紧密关联上下文,输入风格更加口语化。
RAG
大模型
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100