首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· ChatGLM智谱清言
· SD入门教程二:文生图基础用法(提示词)
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· AI换脸工具:facefusion使用心得
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
· prompt中的分隔符号的正确使用方法
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
教育
解读:一个数学在线教育网站如何做到一千万月访问量
另外说下第4名,大家有没有
觉
得眼熟?
访问量
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
领先技术,展现惊艳效果 从实验结果看,PersonaTalk在视
觉
效果、口型精度和个性化保留方面,表现远超同类模型,甚至无需额外的微调,就能实现对特定人物的精确配音。
PersonaTalk
视频
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
「高质量视频生成」 视
觉
质量:MimicTalk生成的3D头像在视
觉
质量上超越了以往的技术,能够生成「高度逼真的面部细节和表情」。
MimicTalk
开源模型
视频
字节跳动推出MagicVideo-V2:引领AI视频生成新时代。
它可以帮助这些专业人士快速将创意转化为视
觉
内容,制作出既高质量又富有创意的视频。
MagicVideo-V2
视频生成
ComfyUI
ComfyUI环境方面开窍了,成功跑通animatediff
如果报错,多半是视
觉
加载器有问题,因为这个名字让我不知道选哪个,我是XL模型,最后试下来应该选pytorch_model.bin IPAdapter完事~ 然后试一下animateDiff的工作流
animatediff
文生图
人工智能
生成式人工智能的“经济学”,The Economic Case for Generative AI
但是,仅仅过了3年,大家都
觉
得“AI这个行业已经死了”。
生成式人工智能
经济学
换脸
技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
关于Instant ID模型的使用方法就介绍到这里,总体测试下来感
觉
,人物的相似度还是非常高的,比起之前的一图换脸插件roop的效果提升了不止一点点,甚至可以与lora模型不相上下。
Instant
ID
文生图
大模型
OCR的终极解法——传统算法VS多模态大模型
· 视
觉
问答: 回答关于图像内容的问题。
OCR
大模型
文字识别
数字人
数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
硅基智能提供了51个,数量多但质量有些参差不齐,有些数字人像是充数的感
觉
。
数字人
数字分身
理解 o3 及其技术分析
应该说顶级数学家评价非常有挑战性的问题,看到GPT4之后他仍然
觉
得会需要几年时间AI才能搞定的问题,现在已经沦陷了1/4。
o3
技术分析
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
光集成的工具就有这么多,比如NLP、语音、视
觉
、多模态等多种模型,以及默认集成知识检索、API检索等方案。
大模型
数据库
颠覆数据存储方式:向量数据库的威力
[0.12, 0.32, -0.5] 在计算机视
觉
中,图像可以通过一组数值(即像素值)表示,这组数值构成一个向量。
编程
数据库
将文本转化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
DeepMotion致力于通过物理模拟、计算机视
觉
和机器学习让数字角色栩栩如生,持续革新动画行业。
3D
动作捕捉
开源
GLM4 开源了!!!还有多模态
多模态能力,视
觉
与语言的融合 GLM-4V-9B 是基于 GLM-4-9B 的多模态模型,具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在多模态评测中表现超越了多个竞争对手
智普
ChatGLM
多模态
写作
AI 写作:如何把GPT变成你的爆文写作素材库?
很多人之所以
觉
得自己的素材库不好用,就是因为内容太多了,质量有良莠不齐。
AI写作
GPT
<
...
24
25
26
27
28
29
30
31
32
33
...
>
1
2
4
5
6
7
8
9
100