首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 高级 RAG 技术——图解概览
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 扣子更新图像流功能,字节版 ComfyUI 来了!
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法
· ChatGLM智谱清言
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
视频
Stability AI推出视频生成
模
型
Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成
模
型
,该
模
型
基于该公司现有的Stable Diffusion文本转图像
模
型
,能够通过对现有图像进行动画化生成视频
Video
视频创作
SD
ComfyUI
StableDiffusion升级版SDXL:一键运行包ComfyUI和18G
模
型
分享!
·
模
型
很
大
,体积很
大
,参数很
大
,35/66亿。
comfyui
sdxl
文生图
解读wav2lip:探究
语
音驱动唇部动作的技术原理!
二、 本文方法介绍 wav2lip
模
型
的训练分为两个阶段,第一阶段是专家音频和口
型
同步判别器预训练;第二阶段是GAN网络训练。
wav2lip
语音
如何从零开始训练专属 LoRA
模
型
?4600字总结送给你!
本文主要介绍如何训练 LoRA
模
型
,LoRA 是一种轻量化的
模
型
微调训练方法,是在原有
大
模
型
的基础上,对
模
型
进行微调,从而能够生成特定的人物、物品或画风。
训练
Google
再超Transformer!Google| 提出两个新
模
型
(Griffin、Hawk),强于Mamba,更省资源
我们知道,循环神经网络(RNN)在深度学习和自然
语
言
处理研究的早期发挥了核心作用,并在许多应用中取得了实功,包括谷歌第一个端到端机器翻译系统。
transformer
训练
Prompt
【SD魔法手册】之25个常用服饰类咒
语
(Prompt)
基础咒
语
Prompts(正向提示词,正咒): absurdres, highres, ultra detailed, (1 young beautiful girl, solo:1.1), (fashion
提示词
SD
【AI代理】扣子,开始探索多代理
模
式
代理
模
式不仅可以拓展
大
模
型
的功能(比如给
大
模
型
加上网页搜索,加入知识库等),还可以规避
大
模
型
的弱点(比如需求是一段代码,但是
大
模
型
回复的内容不单单包含代码,还有一些解释
语
句)。
多代理模式
大模型
ChatGPT
ChatGPT丨一次性修改全文的提示
语
!
当需要一次性修改全文的格式时,可以使用提示词来改进文章的结构、
语
言
和流畅性: 1.
写文章
换脸
除了深度换脸、
模
拟配音,还能口
型
匹配的AI软件出现了
目前LipDub 支持28种
语
言
,包括韩
语
、西班牙
语
、捷克
语
、泰米尔
语
和乌克兰
语
,它采用零镜头
模
式,可以在Captions的视频生成
模
型
在没见过主题的情况下推出流畅的视频。
AI
开源
Stability AI开源上新:3D生成引入视频扩散
模
型
也就是说,此番登场的SV3D首次将视频扩散
模
型
应用到了3D生成领域。
sv3d
建模
微信向量检索分析一体化数仓探索:OLAP For Embedding
背景 在过去的一年里,
大
型
语
言
模
型
(LLM) 以及 ChatGPT 等产品吸引了全世界的想象力,推动新一轮技术浪潮。
OLAP
For
Embedding
一体化数仓
语
音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper简介 faster-whisper是基于OpenAI的Whisper
模
型
的高效实现,它利用CTranslate2,一个专为Transformer
模
型
设计的快速推理引擎。
语音识别
Faster-Whisper
「
语
音转换新速度」— 探秘Whisper JAX的70倍速提升
它是OpenAI的Whisper
模
型
的JAX版本,实现了在TPU上高达70倍的速度提升,这不仅是对现有技术的重
大
突破,更是对未来潜力的一次展现。
Whisper
语音识别
Stable Diffusion
挑战真实影像!Stable Diffusion超越摄影师的光影
模
型
主要是
模
型
高度同质化,且光影处理不佳。
AI图片
比 Roop 和 Reactor 更像!IP Adapter 新
模
型
为任何人做写真
标题:IP-Adapter 新
模
型
超越 Roop 和 Reactor:更完美的角色一致性和相似性 继我们上一篇文章介绍了IP-Adapter的新
模
型
Face ID Plus V2之后,今天我们将深入探讨如何将这一强
大
工具用于生成具有高度个性化特征的人物肖像
IP-Adapter
文生图
<
...
29
30
31
32
33
34
35
36
37
38
...
>
1
2
4
5
6
7
8
9
100