首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· ChatGLM智谱清言
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 大模型的研究新方向:混合专家模型(MoE)
· 我去华强北走了一圈,发现这里正被另一种 AI 包围
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· SD入门教程二:文生图基础用法(提示词)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
Stability AI开源上新:3D生成引入视频扩散模型
§ 条件输入:输入图像通过VAE编码
器
嵌入到潜在空间中,会和噪声潜在状态合并,一起输入到UNet中;输入图像的CLIP嵌入矩阵则被用作每个Transformer模块交叉注意力层的键值对。
sv3d
建模
ComfyUI
ComfyUI学习笔记2,一文看透Workflow
上图,从最左边加载模型开始,经过中间的CLIP Text Encode对关键词Prompt做处理,加入一个初始的Latent Image,然后是采样
器
,VAE解码,最后得到生成的图像。
comfyui
文生图
换脸
10秒换脸,一张图片够了!SD Roop插件教程
如下图 选择“手动设置代理”,点击“编辑” 打开“使用代理服务
器
”选项,将上图代理ip地址和端口记录下来,点保存按钮退出。
AI换脸
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
,就是控制,可以用调色来比喻,无论是图片调色还是视频调色都要用到很多工具,白平衡校准,色温,色相饱和度,亮度,蒙版降噪,锐化,视频的工具会多一点蒙版追踪后,人物肤色,抠像等,这个也是一样,不同的预处理
器
,
Stable
Diffusion
文生图
controlnet
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
代理是一种人工实体,能够通过传感
器
感知周围环境,做出决策,并通过执行
器
采取相应的行动。
大模型
人工智能
Gartner:2024年人工智能渗透的十大战略技术趋势
3.AI-增强开发 AI 增强开发是使用 AI 技术(如 GenAI 和机
器
学习)来帮助软件工程师设计、编码和测试应用程序。
Gartner
人工智能
写作
终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
01 文章标题生成 HEADLINES Prompt 1通用标题党生成
器
根据给定的主题或内容 {{主题}},请使用你的创造力和想象力
写文章
企业
检索增强生成(RAG):LLM企业级应用落地的挑战与思考
RAG的工作原理 RAG系统典型由三部分组成: (1) 检索
器
:从大规模文本数据中检索与输入查询相关的文本片段。
大语言模型
RAG检索增强
人工智能
AI产品经理视角:如何构建人工智能产品
这可以是标准机
器
学习数据集,也可以是具有不同初始目的(您可以根据任务进行调整)的数据集。
大模型
产品经理
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
它集成了先进的语音增强(Speech Enhancement)、语音分离(Speech Separation)和音视频扬声
器
提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音频
ClearerVoice-Studio
语音
大模型
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
模型架构 Gemma 模型架构基于 Transformer 解码
器
,表 1 总结了该架构的核心参数。
开源模型
Gemma
OpenAI
基于 OpenAI Whisper 模型的实时语音转文字工具
还提供直观的图形界面,可以通过拖放界面元素来设置和控制音频处理效果和合成
器
。
WhisperLive
音频
开源软件
盘点字节跳动最新的AI应用
还有“灵感”板块展示最近优秀的作图案例: 02 扣子 AI应用开发平台 Flow “扣子”是字节跳动开发的AI聊天机
器
人开发平台,可以被称之为字节版“GPT”。
字节
AI工具
开源
46.6k星星!最强开源AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
也可以把它当做一个文档管理
器
,也非常好用,各种操作体验直接拉满。
AI开源
集合
商汤
冲击传统模特,商汤发布高质量虚拟试衣Diffusion模型
LDM通过在潜空间上使用一组冻结的编码
器
-解码
器
来降低扩散模型的计算复杂度和计算资源要求。
文生图
<
...
36
37
38
39
40
41
42
43
44
45
...
>
1
2
4
5
6
7
8
9
100