首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· Suno音乐新手指南(手把手完整版教程)
· 剪映专业版智能补帧
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
ChatGLM3-6B:新一代开源双语对话语言模型,流畅对话与低部署门槛再升级
尽管模型在训练的各个阶段都尽力确保数据的合规性和准确性,但由于 ChatGLM3-6B 模型规模较小,且模型受概率随机性因素影响,无
法
保证输出内容的准确。
ChatGLM3
语音模型
开源模型
开源
开源免费离线语音识别神器whisper如何安装
本文目的 网络上有些教程只展示了whisper使用的效果,没有介绍怎么安装,为避免大家在安装上踩坑,同时也为了避免自己以后万一哪天电脑崩溃需要重装whisper的时候再踩坑,我在这里记录下安装方
法
。
wisper
翻译
免费
Stable Diffusion
stable diffusion 远端跑图—— Api基础知识掌握
; "sd_model_checkpoint" :"wlop-any.ckpt [7331f3bc87]"}, // 一般用于修改本次的生成图片的stable diffusion 模型,用
法
需保持一致
文生图
api
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
无监督的嵌入映射(Unsupervised Embedding Mapping):这是一种可以把不同语言的语音或文字的内部表示,映射到一个共同的空间的方
法
。
Translatotron
语音识别
儿童
AI赋能实验室:儿童绘本插图
--ar 16:9 --v 6.0 --s 250 --style raw 译文: 这是一个充满奇妙想象的儿童插图,描绘了一个充满好奇的[动物]在一个充满活力和魔
法
的[地点]展开了一段愉快的冒险
插画
文生图
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
CM3leon是第一个使用从纯文本语言模型改编的方
法
进行训练的多模态模型,包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。
文生图
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
在这篇博客文章中,我们将深入研究这两种方
法
在LlamaIndex中的实现。
RAG
检索
Github
GitHub工程师分享开发Copilot所采用的提示词工程
总的来说,他们建议的方
法
是基于一系列步骤的。
开源模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
2、流匹配技术: F5-TTS中采用了先进的流匹配技术,这是一种基于最优传输路径的方
法
,用于改进生成模型的学习过程。
F5-TTS
音频克隆
FaceFusion又更新咯,增强功能再增强!
; 依赖更新到最新 包含了演示素材 包含了各类模型 界面和提示全部做了汉化 解除了XX限制 解决启动时需要魔
法
的问题
FaceFusion
文生图
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
不同于现有方
法
直接用现成的 CLIP 词表,Vary 分两个阶段:第一阶段先用一个很小的 Decoder-only 网络用自回归方式帮助产生一个强大的新视觉词表;然后在第二阶段融合新词表和 CLIP 词表
OCR
手写
文字识别
RAG
LangChain - RAG:线上系统多文档要频繁更新,每次都要重新花钱做一次 embedding,老板不批预算,批我...
之前针对没个 chunk 做一次 hash,记录下来 hash 值,每次源数据更新了只需要在这一步里面比对一下,更新的 chunk 对应的 embedding 删掉,生成新的插入到原有向量数据库中就好,类似的方
法
大模型
AI改变未来,ChatDoc手把手教你写研报
需要强调一个前提,AI再好,也是工具,如果你缺乏对相关领域(比如,财报常识)的知识体系,就无
法
高效的和AI互动。
大模型应用
写作
Stable Diffusion
Stable Diffusion高精度换脸
chilloutmix_NiPrunedFp32Fix.vae.ckpt Lora模型: 反向tag: CLIP 终止层数:2 正向提示词: 反向提示词: 迭代步数 (Steps):40 采样方
法
Stable
Diffusion
文生图
Stable Diffusion
Stable Diffusion插件:提示词
安装 方
法
一,通过 WebUI 的扩展功能进行安装: 插件地址:https://github.com/Physton/sd-webui-prompt-all-in-one 启动 Stable Diffusion
Stable
Diffusion
提示词
<
...
73
74
75
76
77
78
79
80
81
82
...
>
1
2
4
5
6
7
8
9
100