首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 盘点字节跳动最新的AI应用
· 微软、OpenAI大佬暗示LLM应用开发范式迁移:从Prompt Engineering到Flow Engineering
· 好看的图片不知道怎么写提示词?用AI读出来
· 一键复用!Stable Diffusion WebUI 神仙插件 LightFlow
· ComfyUI | 这么入门就顺了,硬入疼的是自己
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
等待几分钟后,部署完成,就会跳转到资
源
列表: 三、操作应用 1、因为我没有云盘,没有启用自定义模型上传支持,不能上传模型,这里只显示了一个网址,就是SD操作界面的网址,点击应用地址
下载
开源模型
Github
我去,找到一个Github上非常优秀的AI项目,可控制鼠标、键盘,模拟人类操作,太丝滑,收藏~~~
Cradle 是由 BAAI‑Agents 团队
开
源
的一款面向 通用计算机控制(GCC) 的多模态 AI Agent 框架,可以让大型多模态模型,通过截图输入和键鼠输出
AI
Agent
开源项目
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已
开
源
!
Vary 的训练方法和模型结构如下图: 通过在公
开
数据集以及渲染生成的文档图表等数据上训练,Vary 极大增强了细粒度的视觉感知能力。
OCR
手写
文字识别
ComfyUI
再见了ComfyUI,WebUI也有了工作流
在AI绘画领域,Stable Diffsion是最受欢迎的,因为它是
开
源
软件。
ComfyUI
WebUI
文生图
大模型
OpenAI
开
源
大模型调测工具Transformer Debugger:可以在训练大模型之前理解模型的运行情况并干预
自从OpenAI转向盈利化运营之后,很少再
开
源
自己的技术。
大模型
调试工具
大模型
中文通用大模型最全汇总
同时我们也考虑更为快速的中文适配方案:Chinese-LlaMA2-sft-v0: 采用现有的
开
源
中文指令微调或者是对话数据,对LlaMA-2进行直接微调 (将于近期
开
源
)。
大模型
开源模型
ComfyUI
ComfyUI,你
开
启XL钥匙打
开
了新世界
但在与大家一起努力学习,了解了ComfyUI后,我有点难以抑制的激动,我觉得之前称呼这个“
开
启XL大门的钥匙”有些欠妥,它应该是
开
启AIGC新世界大门的钥匙!
ComfyUI
大模型
Stable Diffusion
【Stable Diffusion】SD迎来动画革命,AnimateDiff快速出图
今天给大家介绍一个可以快速在sd中生成动画的方法,就是一个叫做AnimateDiff的免费
开
源
项目。
文生图
开源模型
OpenAI
基于 OpenAI Whisper 模型的实时语音转文字工具
今天给大家分享一款专注于音频处理和创作的
开
源
软件【WhisperLive】 什么是 WhisperLive?
WhisperLive
音频
开源软件
工具
搭建程序员自己的在线工具库 it-tools
虽然有一些
开
发工具也具有一些常用的格式化功能,有时候,我们可能也需要一些其它轻量级的工具。
开源项目
工具类
阿里
阿里巴巴语音实验室发布
开
源
语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
Speech Enhancement)、语音分离(Speech Separation)和音视频扬声器提取(Audio-Video Speaker Extraction)功能,能够在嘈杂环境中清理音频、分离复杂声
源
并结合音频和视觉数据锁定目标发声者
ClearerVoice-Studio
语音
Stable Diffusion
Stable Diffusion 入门教程
开
篇
是由CompVis、Stability AI 和 LAION 的研究人员于 2022 年发布的一款文本到图像生成的潜在扩散模型,基础版SD1.5(512*512),SD2.1(768*768),后又
开
源
了
Stable
Diffusion
文生图
入门教程
ComfyUI
使用ComfyUI玩SDXL的正确打
开
方式
就好像
开
汽车时,手动挡和自动挡的区别。
文生图
ComfyUI
阿里
【语音领域-又双叒更新】阿里
开
源
FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
arxiv.org/pdf/2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是阿里语音团队最新
开
源
的项目
asr
tts
声音
ComfyUI
ComfyUI环境方面
开
窍了,成功跑通animatediff
但我不想重复放这里面,于是
开
始找代码大法: 懂了,在IPAdapterPlus里面把路径改成sd那个模型在的文件夹。
animatediff
文生图
<
...
10
11
12
13
14
15
16
17
18
19
...
>
1
2
4
5
6
7
8
9
100