首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· SD入门教程二:文生图基础用法(提示词)
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· openpose原理及安装教程(姿态识别)
· AI声音克隆 | 最全最简教程(权威版)
· 自己电脑上跑大语言模型(LLM)要多少内存?
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 从 GPT-4o 到 LiveKit:实时语音交互的开源实现
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
领先技术,展现惊艳效果 从实验结果看,PersonaTalk在视
觉
效果、口型精度和个性化保留方面,表现远超同类模型,甚至无需额外的微调,就能实现对特定人物的精确配音。
PersonaTalk
视频
【提前体验GPT-5】吴恩达AI智能体工作流详细解读
二、使用工具(Tool use) 大语言模型本身也不是万能的,比如吴恩达提到,在早期视
觉
研究领域,大模型便需要依靠视
觉
处理工具才能实现对图像视频等内容的处理。
GPT-5
智能体
视频
字节跳动推出MagicVideo-V2:引领AI视频生成新时代。
它可以帮助这些专业人士快速将创意转化为视
觉
内容,制作出既高质量又富有创意的视频。
MagicVideo-V2
视频生成
人工智能
生成式人工智能的“经济学”,The Economic Case for Generative AI
但是,仅仅过了3年,大家都
觉
得“AI这个行业已经死了”。
生成式人工智能
经济学
理解 o3 及其技术分析
应该说顶级数学家评价非常有挑战性的问题,看到GPT4之后他仍然
觉
得会需要几年时间AI才能搞定的问题,现在已经沦陷了1/4。
o3
技术分析
换脸
技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
关于Instant ID模型的使用方法就介绍到这里,总体测试下来感
觉
,人物的相似度还是非常高的,比起之前的一图换脸插件roop的效果提升了不止一点点,甚至可以与lora模型不相上下。
Instant
ID
文生图
数字人
数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
硅基智能提供了51个,数量多但质量有些参差不齐,有些数字人像是充数的感
觉
。
数字人
数字分身
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
光集成的工具就有这么多,比如NLP、语音、视
觉
、多模态等多种模型,以及默认集成知识检索、API检索等方案。
大模型
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
「高质量视频生成」 视
觉
质量:MimicTalk生成的3D头像在视
觉
质量上超越了以往的技术,能够生成「高度逼真的面部细节和表情」。
MimicTalk
开源模型
数据库
颠覆数据存储方式:向量数据库的威力
[0.12, 0.32, -0.5] 在计算机视
觉
中,图像可以通过一组数值(即像素值)表示,这组数值构成一个向量。
编程
数据库
ComfyUI
ComfyUI环境方面开窍了,成功跑通animatediff
如果报错,多半是视
觉
加载器有问题,因为这个名字让我不知道选哪个,我是XL模型,最后试下来应该选pytorch_model.bin IPAdapter完事~ 然后试一下animateDiff的工作流
animatediff
文生图
大模型
OCR的终极解法——传统算法VS多模态大模型
· 视
觉
问答: 回答关于图像内容的问题。
OCR
大模型
文字识别
将文本转化为3D动画:DeepMotion推出MotionGPT,开启动画新时代!
DeepMotion致力于通过物理模拟、计算机视
觉
和机器学习让数字角色栩栩如生,持续革新动画行业。
3D
动作捕捉
开源
GLM4 开源了!!!还有多模态
多模态能力,视
觉
与语言的融合 GLM-4V-9B 是基于 GLM-4-9B 的多模态模型,具备 1120 * 1120 高分辨率下的中英双语多轮对话能力,在多模态评测中表现超越了多个竞争对手
智普
ChatGLM
多模态
LLM
自己电脑上跑大语言模型(LLM)要多少内存?
我感
觉
这个建议足够普通用户使用了。
大语言模型
运行
<
...
24
25
26
27
28
29
30
31
32
33
...
>
1
2
4
5
6
7
8
9
100