首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· PPT又又有新突破了!智谱AI代码流造PPT
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· StreamingLLM 框架:利用最新标记让 AI 记住你的话、创作长篇小说,探索无限长度文本
· 【爆肝整理】500+ AI 最佳提示词
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· AIGC工具提示词技巧
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源免费离线语音识别神器whisper如何安装
whisper介绍 Open
AI
在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨识。
wisper
翻译
免费
工具
鹅厂最新
AI
工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
大
厂们在整活方面开始卷起来了!
PhotoMaker
图生图
微软
微软打破Decoder-Only架构!
大
幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
去年一张“
大
语言
模
型
进化树”动图在学术圈疯转,
模
型
架构还只有三
大
类:Decoder-Only、Encoder-Only、Encoder-Decoder。
Decoder-Decoder
YOCO
架构
Midjourney
【万字干货】掌握 Midjourney 提示词技巧成为 25 个流派的摄影
大
师
这种类
型
的摄影的本质是捕捉食物的颜色、质地和摆放。
文生图
训练
提示词
Midjourney
Stable Diffusion
Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
:输入“
AI
”进行搜索,选择 Stable Diffusion
AI
绘画自定义
模
型
版。
下载
开源模型
提示词
45个 DALL-E 3 使用案例 (附提示词)
借助于 Transformer
模
型
优秀的自然语言能力,它可以精准地理解你的设计需求,并近乎如实地反映在画面上。
DALL-E
提示词
文生图
开源
F5-TTS:上海交
大
开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
上海交
大
开源的F5-TTS实测下来确实是还不错了。
F5-TTS
音频克隆
Stable Diffusion
Stable Diffusion基础:ControlNet之图片高仿
今天继续给
大
家分享
AI
绘画中 ControlNet 的强
大
功能,本次的主角是 Reference,它可以参考一张图片生成另一张看起来差不多的图片,这句话说起来有点绕,如果换成高仿,
大
家应该就明白了吧。
文生图
视频
超越Animate Anyone! 南加
大
&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
此外,MagicPose
模
块可以被视为原始文本到图像
模
型
的扩展/插件,而无需修改其预训练的权重。
MagicPose
视频
Stable Diffusion
Stable Diffusion教程:文生图
最近几天
AI
绘画没有什么
大
动作,正好有时间总结下Stable Diffusion的一些基础知识,今天就给
大
家再唠叨一下文生图这个功能,会详细说明其中的各个参数。
文生图
Stable
Diffusion
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
前段时间,「霉霉
大
秀中文」的视频在各个社交媒体走红,随后又出现了「郭德纲
大
秀英语」等类似视频。
语音
HeyGen
Fastwhisper + Pyannote 实现 ASR + 说话者识别
前言 最近在研究ASR相关的业务,也是调研了不少
模
型
,踩了不少坑,ASR这块,目前中文普通话效果最好的应该是阿里的modelscope上的中文
模
型
了,英文的话,还是非whisper莫属了,而且
faster-whisper
语者识别
ASR
教程
SD入门教程六:ControlNet基础入门
通俗的讲,就是输入一些额外的控制参数,然后通过所对应的辅助
模
型
(ControlNet专用
模
型
)去控制图片的生成结果,这些控制参数可以是线稿图,深度图,人体姿态图,法线图等。
ControlNet
文生图
LLM
PymuPDF4llm:PDF 提取的革命
随着人工智能和自然语言处理技术的发展,对能够与
大
型
语言
模
型
(LLMs)无缝配合的 PDF 提取工具的需求日益增长(利用LLM从非结构化PDF中提取结构化知识)。
PymuPDF4llm
PDF
Stable Diffusion
Stable Diffusion 抽卡必备神器!Agent Scheduler
相信
大
家在玩 Stable Diffusion 的时候一直有一个痛点,每次出图抽卡时都只能等待上一次抽卡结束,才能继续下一次抽卡; 特别是当我们想抽
大
量的卡来测试不同的
模
型
,不同的参数的效果时,那么是非常奔溃的
Agent
Scheduler
Stable
Diffusion
<
...
67
68
69
70
71
72
73
74
75
76
...
>
1
2
4
5
6
7
8
9
100