首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 个人从零预训练1B LLM心路历程
· 盘点数据安全合规方向的热门证书【快来了解一下】
· 造梦师手记:SDXL迎来了AI插画师
· 6个最佳开源TTS引擎
· 开源新标杆,千问Qwen2系列模型发布,全面超越LLama3
· 从 GPT-4o 到 LiveKit:实时语音交互的开源实现
· 从零开始:构建你的首个ComfyUI工作流
· 使用stable diffsion对老照片进行AI高清放大修复
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
必读!RAG好用的3种Router
目前开源了很
多
LLMs大
模
,虽然GPT4o一直占据第一位的宝座,但是并不是在每个领域都很强。
RAG
Router
RAG
检索增强生成(RAG)有什么好的优化方案?
2)
多
模
态
RAG(文本+表格+图片) 对
多
模
态
RAG而言,有三种技术路线[10],见下图: 图7
多
模
态
RAG 如图7所示,对
多
模
态
RAG而言有三种技术路线,如下我们做个简要说明: ·&ensp
RAG
检索增强
开源
开源大语言
模
型完整列表
VisualGLM-6B ——
多
模
态
对话语言
模
型 VisualGLM-6B 是一个开源的,支持图像、中文和英文的
多
模
态
对话语言
模
型,语言
模
型基于 ChatGLM-6B,具有 62 亿参数;图像部分通过训练
开源模型
大语言模型
SDXL
说真的,SDXL究竟藏着
多
少秘密,也许没人知道
探索功能,线上部署,更新工作流……我只想告诉你,SDXL不是一个绘图
模
型那么简单,在它里面,隐藏着太
多
不为人知的秘密。
文生图
SeaTable 一站式助力高校
多
场景数字化升级,打造高效解决方案
已经在
多
所知名高等教育机构中得到应用和肯定。
大模型
Prompt
AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动
态
提示词)
今天带来抽卡神器:dynamic prompts(动
态
提示词) 插件可以大幅提升抽卡的效率,结合前面的提示词合集 让我们开启无限抽卡之旅吧!
AI图片
开源
摆脱 OpenAI 依赖,8 分钟教你用开源生
态
构建全栈 AI 应用
摆脱对 OpenAI 的依赖,借助开源生
态
系统构建出全流程的 AI 应用,现在开始!
开源模型
语音
GLM-4-Voice 9B——实时
多
语言语音对话 AI——几分钟内即可在本地安装
然而,大
多
数
模
型在流利地切换语言、理解口语查询的细微差别以及提供高质量响应方面仍然面临挑战。
GLM-4-Voice
9B
语音
安装
StableDiffusion
深度解析丨StableDiffusion在
多
个设计场景中的探索与应用
本文将深入解析StableDiffusion在
多
个设计场景中的探索与应用,尤其关注如何利用其制作
多
种商业落地案例。
文生图
斯坦福宣布前端开发要失业了?!一张截图生成代码,64%优于原网页!
随着生成型人工智能(AI)的飞速发展,
多
模
态
理解和代码生成的能力达到了前所未有的水平。
设计转代码
大模型
Fastwhisper + Pyannote 实现 ASR + 说话者识别
whisper很变
态
,粤语效果也还不错,因此,如果实际业务中需要涉及到不同的语言,还是更推荐whisper
多
一点 一、faster-whisper简单介绍 faster-whisper是使用
faster-whisper
语者识别
ASR
语音
6.2K Star!MIT出品的
多
语言语音合成神器,CPU实时推理吊打商业软件!
开源TTS能有
多
好?
MeloTTS
语音工具
AI资讯速递 - 快人一步!为你填平AI领域信息差及时揭示AI领域的最新动
态
在这个数字化转型的浪潮中,人工智能(AI)的发展速度之快,已经超出了大
多
数人的想象。
AI资讯
AI新闻
开源
开源语音大语言
模
型来了!阿里基于Qwen-Chat提出Qwen-Audio!
然而,语言
模
型缺乏像人类一样感知非文本
模
态
(如图像和音频)的能力。
大模型
语音
京东
多
智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
Agent调度
模
型:项目经理 vs 自由导演 🧠 这是
多
智能体框架的“大脑”,决定了Agent们如何思考和协作。
JoyAgent
langchain
LangGraph
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100