首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Suno音乐新手指南(手把手完整版教程)
· 中文开源OCR框架对比及介绍
· 如何构建基于大模型的App
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· 忘掉 RAG,未来是 RAG-Fusion!搜索的下一个前沿:检索增强生成遇上倒数排名融合和生成查询
· Deepseek-V2技术报告解读!全网最细!
· 真格基金大模型能力测试问题集---进阶篇
· 第3期 SDXL和SD的10大区别!你知道几个?
· 11个顶级的Prompts,用GPT学习的天花板
· AI备案实战指引
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
视频
Stability AI推出视频生成
模
型
Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成
模
型
,该
模
型
基于该公司现有的Stable Diffusion文本转图像
模
型
,能够通过对现有图像进行动画化生成视频
Video
视频创作
SD
ComfyUI
StableDiffusion升级版SDXL:一键运行包ComfyUI和18G
模
型
分享!
·
模
型
很
大
,体积很
大
,参数很
大
,35/66亿。
comfyui
sdxl
文生图
如何从零开始训练专属 LoRA
模
型
?4600字总结送给你!
本文主要介绍如何训练 LoRA
模
型
,LoRA 是一种轻量化的
模
型
微调训练方法,是在原有
大
模
型
的基础上,对
模
型
进行微调,从而能够生成特定的人物、物品或画风。
训练
Google
再超Transformer!Google| 提出两个新
模
型
(Griffin、Hawk),强于Mamba,更省资源
我们知道,循环神经网络(RNN)在深度学习和自然
语
言
处理研究的早期发挥了核心作用,并在许多应用中取得了实功,包括谷歌第一个端到端机器翻译系统。
transformer
训练
解读wav2lip:探究
语
音驱动唇部动作的技术原理!
二、 本文方法介绍 wav2lip
模
型
的训练分为两个阶段,第一阶段是专家音频和口
型
同步判别器预训练;第二阶段是GAN网络训练。
wav2lip
语音
【AI代理】扣子,开始探索多代理
模
式
代理
模
式不仅可以拓展
大
模
型
的功能(比如给
大
模
型
加上网页搜索,加入知识库等),还可以规避
大
模
型
的弱点(比如需求是一段代码,但是
大
模
型
回复的内容不单单包含代码,还有一些解释
语
句)。
多代理模式
大模型
Prompt
【SD魔法手册】之25个常用服饰类咒
语
(Prompt)
基础咒
语
Prompts(正向提示词,正咒): absurdres, highres, ultra detailed, (1 young beautiful girl, solo:1.1), (fashion
提示词
SD
ChatGPT
ChatGPT丨一次性修改全文的提示
语
!
当需要一次性修改全文的格式时,可以使用提示词来改进文章的结构、
语
言
和流畅性: 1.
写文章
微信向量检索分析一体化数仓探索:OLAP For Embedding
背景 在过去的一年里,
大
型
语
言
模
型
(LLM) 以及 ChatGPT 等产品吸引了全世界的想象力,推动新一轮技术浪潮。
OLAP
For
Embedding
一体化数仓
开源
Stability AI开源上新:3D生成引入视频扩散
模
型
也就是说,此番登场的SV3D首次将视频扩散
模
型
应用到了3D生成领域。
sv3d
建模
换脸
除了深度换脸、
模
拟配音,还能口
型
匹配的AI软件出现了
目前LipDub 支持28种
语
言
,包括韩
语
、西班牙
语
、捷克
语
、泰米尔
语
和乌克兰
语
,它采用零镜头
模
式,可以在Captions的视频生成
模
型
在没见过主题的情况下推出流畅的视频。
AI
语
音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper简介 faster-whisper是基于OpenAI的Whisper
模
型
的高效实现,它利用CTranslate2,一个专为Transformer
模
型
设计的快速推理引擎。
语音识别
Faster-Whisper
「
语
音转换新速度」— 探秘Whisper JAX的70倍速提升
它是OpenAI的Whisper
模
型
的JAX版本,实现了在TPU上高达70倍的速度提升,这不仅是对现有技术的重
大
突破,更是对未来潜力的一次展现。
Whisper
语音识别
Stable Diffusion
挑战真实影像!Stable Diffusion超越摄影师的光影
模
型
主要是
模
型
高度同质化,且光影处理不佳。
AI图片
比 Roop 和 Reactor 更像!IP Adapter 新
模
型
为任何人做写真
标题:IP-Adapter 新
模
型
超越 Roop 和 Reactor:更完美的角色一致性和相似性 继我们上一篇文章介绍了IP-Adapter的新
模
型
Face ID Plus V2之后,今天我们将深入探讨如何将这一强
大
工具用于生成具有高度个性化特征的人物肖像
IP-Adapter
文生图
<
...
29
30
31
32
33
34
35
36
37
38
...
>
1
2
4
5
6
7
8
9
100