首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· GenColor.ai
· 为你推荐开源项目:Meridian——专属个人情报站!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· AI换脸工具:facefusion使用心得
· 变天了,AI可以一键生成中文海报了......
· 详解Stable Diffusion提示词prompt语法
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 企业数字化转型的“阿里阿德涅之线”在哪?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
OpenAI 开源语音识别 Whisper 的使用体验怎么样?
这款工具具有很高的速度,能够在批量处理中大幅提高
生
产效率。
生成式AI
人工智能
目前有哪些比较
成
功的人工智能应用?
代码解释器: 可以
生
成
表格和可
视
化图,让任何人都能
成
为初级数据分析师。
生成式AI
Stable Diffusion
Stable Diffusion | SD的老舅ComfyUI来了,节点式工作流,分部控制出图
ComfyUI 是一个基于节点流程式的stable diffusion
AI
绘图工具WebUI,界面版块基本和stable diffusion一样,只是每个版块被拆分
成
节点,可以灵活控制连接,这样的工作流和完善的可复现性
生成式AI
VividTalk:用一张照片和一段音
频
让人物栩栩如
生
地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,创造出仿佛真人在说话的
视
频
的技术。
VividTalk
视频
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音
视
频
流
轻松访问 LiveKit WebRTC 会话并处理或
生
成
音
频
、
视
频
和数据流。
voice
agent
开源
音视频
生
成
式
AI
工作流#产品经理和创业者的秘密武器
如今,随着ChatGPT、Midjourney、StableDiffusion等
生
成
模型带动起来的热潮,
AI
大模型正逐渐渗透到各种产品和服务中,越来越多的产品经理也在考虑将AIGC(
AI
生
成
内容)能力融入到自己的产品中
AIGC
工作流
开源
爆火「
视
频
版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
,完
成
动态的分割任务: “套上”Real-ESRGAN,则给
视
频
做超分也是信手拈来…… 整个过程非常轻松,不需要对待操作
视
频
进行任何调整或处理。
ControlNet
健康
教小朋友学习
AI
绘画的同时避免
生
成
不健康图片
有朋友咨询,为了避免输在起跑线上,想教小朋友学
AI
绘画,但又不想让孩子接触到不健康图片,有没有办法解决。
小朋友
绘画
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/文本
为了进一步丰富作者的数据集,作者使用了GPT-4o为YouTube上收集的
视
频
生
成
多样化的字幕。
Baichuan-Omni
多模态大模型
ComfyUI
ComfyUI王牌!复合
生
成
!必须揉在一起
上期我们讲了利用基于语言到图像的
生
成
网络的GLIGEN模型可以做到指哪打哪的
生
成
。
comfyui
文生图
Roop参数说明,ROOP->StyleGAN演示!
首先,简单说一下,
视
频
的原素材全部由
AI
生
成
!
视频
StyleGAN
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
不管是唱歌
视
频
,还是讲话
视
频
,只要提供一张肖像照片,外加一段音
频
,算法就会自动
生
成
一段口型完全能对上、画面
生
动的
视
频
出来。
EMO
阿里
全民演唱
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在音
频
驱动的
视
频
生
成
领域,制作普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片音
频
可以
生
成
,而用自己的图片、音
频
生
成
视
频
就不行。
SadTalke
大模型
LLM大模型推理输出
生
成
方式总结
参数设置:do_sample = False, num_beams = 1 缺点: 1、
生
成
文本重复 2、不支持
生
成
多条结果。
大模型
<
...
3
4
5
6
7
8
9
10
11
12
...
>
1
2
4
5
6
7
8
9
100