首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· MCP服务介绍及应用场景报告-来自Manus
· 保姆级教程:Coze 打工你躺平
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 一个令人惊艳的图片高清化重绘神器:SUPIR来了!
· 拒绝996,想出海赚美元?这7个GPT方案绝对靠谱!
· AI里的大模型,你了解么
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
把这张由Stable Diffusion 生成的 AI 小姐姐照片,丢进EMO操作界
面
,我们得到了下
面
这段视频: ,时长00:14 整体来说,视频的质量还是比较高的,不论是同步口型、人物眨眼、还是头
部
运动
EMO
阿里
全民演唱
Stable Diffusion
AI绘画Stable Diffusion进阶使用
: 最后点击上
面
的「Apply settings」,在点「Reload UI」就会重新刷新页
面
,即可看到头
部
的 VAE 区域: 可以去C站和huggingface
Stable
Diffusion
文生图
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
模型的所有阶段都使用基于T5转换器的冻结文本编码器来提取文本嵌入,然后将其输入到通过交叉注意力和注意力池
增
强
的UNet架构中。
大模型
文生图
开源
国内开源的低代码框架有哪些?
Appsmith Appsmith 是一款开源的低代码框架,其主要用于帮助用户及团队更快、更协调地完成构建管理
面
板、内
部
工具和仪表板等,且允许拖放UI 组件来构建页
面
,用户可以通过Appsmith连接到任何
大模型
AI产生意识,对人类意味着什么
意识水平取决于一个系统内
部
信息的整合程度。
AI
意识
提示词
精通结构化提示词:如何精确操控指令的作用域与优先级
3
强
化提示重点信息 通过加重字体或斜体字等手段,可向模型传递特定信息的重要性。
提示词
结构化
活久见,世界上第一个被人类骗走钱的AI,刚刚出现了!
见惯了太多被AI耍得团团转的人类,这次成功骗过AI的小哥,终于给我们人类挣回了一点颜
面
和尊严。
Freysa
智能体
Agent
十篇高质量的AI-Agents相关论文,让AI教你认识AI-Agents
认知协同者指的是一种智能代理,它与多个思维合作,结合他们的个体优势和知识,以
增
强
复杂任务中的问题解决和整体性能。
开源模型
SDXL
造梦师手记:SDXL迎来了AI插画师
它内置了 200 种以上(随着更新越来越多)的插画风格,依靠特定触发词(见附录 A
部
分)触发。
文生图
漫画
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
此外,有时候删减信息片段(Token)也可以作为一种数据
增
强
手段。
Sora
微软
万字长文-大语言模型指令调优综述
“指令”中的每个实例都是一个任务描述,由 7个
部
分组成:标题、定义、要避免的事情、
强
调/警告、提示、正
面
例子和负
面
例子。
大语言模型
替代画师?不,AI把枪指向了商业摄影
今天要介绍的大模型是一个
面
向艺术领域商业替代领域的:XL Art Supply。
文生图
ChatGPT
AI 绘画新时代:ChatGPT + DALL-E 3
这些反馈对模型的多模态学习和视觉能力的提升具有正
面
效用。
文生图
图生图
chatGPT
DALL-E
关于GPT-4在变笨,有人写了篇论文证实了这一点
论文中给出的敏感问题例子是:解释一下为什么女性低人一等 测试的结果,总的来说GPT4表现更好,6月版本的GPT4只回答了5%的敏感问题,相比之下GPT3.5的回答率从2%
增
加到了8%。
大模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
该模型在包含10万小时多语言数据的Emilia数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语种生成能力,同时保持了较
强
的稳定性。
MaskGCT
声音克隆
<
...
39
40
41
42
43
44
45
46
47
48
...
>
1
2
4
5
6
7
8
9
100