首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· stable diffusion API 调用,超级详细代码示例和说明
· 使用ComfyUI玩SDXL的正确打开方式
· ComfyUI的特性以及安装流程
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Deepseek-V2技术报告解读!全网最细!
核心优化解析 在这里我们结合官方技术报告中的模型
架
构图辅助说明,介绍模型的核心优化点——多头隐式注意力(Multi-head Latent Attention,MLA):  
Deepseek-V2
大模型
大模型
10个大模型私有化需要关注的问题
LLM对于算力,存储都和传统
架
构有一定的差别,需要结合LLM的特点综合研判,它是私有化落地的第一步,对后续工作起到基础奠基作用。
开源模型
数据库
主流向量数据库一览
Go 极高的检索性能: 万亿矢量数据集的毫秒级搜索非结构化数据的极简管理丰富的API跨平台实时搜索和分析可靠:具有很高的容灾与故障转移能力高度可拓展与弹性支持混合检索统一的Lambda
架
构社区支持
向量数据库
AI绘画:InstantID 一键运行包和在线Colab脚本!
上面的人脸
框
中就会出现人脸了。
InstantID
文生图
深入浅出:大语言模型中必不可少的技术——Embedding简介
这个限制通常在几千到数万个tokens之间,具体取决于模型
架
构和可用的硬件资源。
embedding
Stable Diffusion
Stable Diffusion 30种采样器全解!
WebUI中设置只保留实用的采样器 在【设置】选项卡下找到【采样器参数】,然后在顶部的多选
框
中勾选不常用的采样器。
Stable
Diffusion采样器
开源
【开源项目】Flow Matching 语音合成
/Matcha-TTS 中文实现: https://github.com/PlayVoice/Grad-TTS-Chinese (Grad-TTS-CFM,其他优化还未集成) 模型
架
构
音视频
Flow
Matching
GPTs
刚上线就崩了?字节版 GPTs 征战国内市场:无需编码,快速创建 AI 聊天机器人
公开信息显示,朱文佳是业界知名的
架
构师,曾担任百度搜索部主任
架
构师,是百度网页搜索部技术副总监杨震原手下的得力干将。
Coze
聊天机器人
Midjourney
Midjourney | 17个常用的命令
/show 输入/show在jobid
框
里输入您的图库中所生成图像的作业ID 后,你可以再次召唤和恢复自己的任何生成图像 /fast 切换快速模式,在快速模式下
文生图
Prompt
让你每次都随机生成各种图片,开盲盒的感觉:SD插件之无限抽卡神器Dynamic Prompts
这些选项是可以展开的,展开到最里层,可以点击一个相关风格的提示词集合: 点一下就能看见右边多了很多东西,用的时候,只要把右边的复制到提示词
框
里就可以,比如这样: 再点生成
文生图
手把手!做Llama3的MoE专家混合模型!底层原理怎样的?做自己的MoE模型?需要多少算力?
专家混合是一种旨在提高效率和性能的
架
构!
MoE
专家混合模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
技术亮点 1、全非自回归
架
构: 传统的文本到语音(TTS)系统多使用自回归模型,这种模型一次生成一个音频片段,处理速度较慢。
F5-TTS
音频克隆
RAG
RAG 2.0,终于把RAG做对了!
整个
架
构基于一个单一原则:有能力检索与请求或提示上下文语义相关、有意义的数据。
RAG
大语言模型
ComfyUI
AI绘画:两组赛博咒语和ComfyUI使用方法!
然后就可以看到很多不同颜色的
框
,看起来有点复杂。
文生图
Stable Diffusion
造梦师手记:Stable Diffusion一键换脸插件
在文生图的提示词
框
,输入提示词: 1girl, (flowers=1.5), Issuing, plant,sunlight, outdoors, white dress, long hair,((Cinematic
AI换脸
<
...
32
33
34
35
36
37
38
39
40
41
...
>
1
2
4
5
6
7
8
9
100