首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Coze多智能体(Multi-Agents)模式体验!
· RAG超参数调优食用指南
· 换脸软件 FaceFusion 保姆级教程
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 更快更好的chatglm3来了
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· Comfyui工作流原理 你都了解吗
· Stable Diffusion图生图(真人转动漫)
· 懒人福音!用AI生成会议纪要,让你的工作更高效!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
F5-TTS:上海交
大
开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
上海交
大
开源的F5-TTS实测下来确实是还不错了。
F5-TTS
音频克隆
微软
微软打破Decoder-Only架构!
大
幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
去年一张“
大
语言
模
型
进化树”动图在学术圈疯转,
模
型
架构还只有三
大
类:Decoder-Only、Encoder-Only、Encoder-Decoder。
Decoder-Decoder
YOCO
架构
Midjourney
【万字干货】掌握 Midjourney 提示词技巧成为 25 个流派的摄影
大
师
这种类
型
的摄影的本质是捕捉食物的颜色、质地和摆放。
文生图
训练
提示词
Midjourney
换脸
技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
这里我已经给
大
家整理好了,只需要到我的云盘里就可以直接下载了,然后将下载好的
模
型
放入到以下路径中——E:\sd-webui-aki-v4.4\extensions\sd-webui-controlnet
Instant
ID
文生图
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
它是OpenAI的Whisper
模
型
的JAX版本,实现了在TPU上高达70倍的速度提升,这不仅是对现有技术的重
大
突破,更是对未来潜力的一次展现。
Whisper
语音识别
换脸
FaceSwapLab,截止2023年8月最好用的一键换脸工具
出现这个问题的原因是AI绘画的人物脸部不同角度时,
模
型
比较难适配完美。
一键换脸
LLM
让AI记住你说的话、让AI给你生成几十万字的小说!StreamingLLM 让无限长token成为可能
如今全世界有很多公司都在研究AI
大
模
型
(LLM)。
StreamingLLM
写作
LLM
PymuPDF4llm:PDF 提取的革命
PDF 文件作为一种广泛使用的文档格式,包含着
大
量有价值的信息。
PymuPDF4llm
PDF
SDXL
它来了!SDXL + ControlNet 终于强强联合!
那么
大
家可能就会会有疑问了,老版本的 ControlNet
模
型
能不能在 SDXL 中使用呢?
SDXL
pdf2htmlEX:效果相当好的一个PDF转HTML程序,和原始PDF几乎一
模
一样。
项目简介 这应该是效果相当好的一个PDF转HTML程序,生成的结果和原始PDF几乎一
模
一样。
PDF转换
视频
超越Animate Anyone! 南加
大
&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
此外,MagicPose
模
块可以被视为原始文本到图像
模
型
的扩展/插件,而无需修改其预训练的权重。
MagicPose
视频
Stable Diffusion
Stable Diffusion 抽卡必备神器!Agent Scheduler
相信
大
家在玩 Stable Diffusion 的时候一直有一个痛点,每次出图抽卡时都只能等待上一次抽卡结束,才能继续下一次抽卡; 特别是当我们想抽
大
量的卡来测试不同的
模
型
,不同的参数的效果时,那么是非常奔溃的
Agent
Scheduler
Stable
Diffusion
Fastwhisper + Pyannote 实现 ASR + 说话者识别
前言 最近在研究ASR相关的业务,也是调研了不少
模
型
,踩了不少坑,ASR这块,目前中文普通话效果最好的应该是阿里的modelscope上的中文
模
型
了,英文的话,还是非whisper莫属了,而且
faster-whisper
语者识别
ASR
教程
SD入门教程六:ControlNet基础入门
通俗的讲,就是输入一些额外的控制参数,然后通过所对应的辅助
模
型
(ControlNet专用
模
型
)去控制图片的生成结果,这些控制参数可以是线稿图,深度图,人体姿态图,法线图等。
ControlNet
文生图
微信向量检索分析一体化数仓探索:OLAP For Embedding
背景 在过去的一年里,
大
型
语言
模
型
(LLM) 以及 ChatGPT 等产品吸引了全世界的想象力,推动新一轮技术浪潮。
OLAP
For
Embedding
一体化数仓
<
...
51
52
53
54
55
56
57
58
59
60
...
>
1
2
4
5
6
7
8
9
100