首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 3.5k star!一款万能的 SQL 分析工具,厉害了!
· PPT又又有新突破了!智谱AI代码流造PPT
· Deepseek-V2技术报告解读!全网最细!
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· SD入门教程四:图生图基础用法
· StableDiffusion模型推荐系列(功能型)
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 盘点字节跳动最新的AI应用
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
国内厂商语音
识
别与Whisper评测:现状与概况对比
一、语音
识
别现状 二、评测意义与预期成果 三、评测方案 四、评测结果 一、语音
识
别现状 得益于近年来深度学习技术的快速发展,人工智能的主要分支(
图
像、语音、自然语言处理等)都相继进入了大规模落地应用阶段
语音识别
Faster-Whisper
ChatGLM
【本地部署】智
谱
chatglm3-6B第三代!性能如何?支持调用tools+Agent+代码执行!小白教程!附网盘下载!
瞄向GPT-4V的技术升级: 瞄向GPT-4V,ChatGLM3 本次实现了若干全新功能的迭代升级,包括: 多模态理解能力的CogVLM,看
图
识
语义,在10余个国际标准
图
文评测数据集上取得SOTA;
chatglm
智普
大模型
Google
AI“同声传译”新进展!Google发布,无监督,语音
识
别:Translatotron 3!
语音
识
别(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音
识
别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
Agent
十篇高质量的AI-Agents相关论文,让AI教你认
识
AI-Agents
我的下一篇将围绕《LLM Powered Autonomous Agents》进行深度解读,并建立相关联的
知
识
体系与在
知
识
库,也将成为一个开源可索引的关于超级个体与AI-Agent的高质量
知
识
库。
开源模型
全球生成式 AI 应用全景
图
生成式 AI 应用按应用领域可以分为工具型应用、通用软件、行业软件、智能硬件四大类,从产品形态上将沿着AIGC(内容生成)、Copilot(智能助手)、Insight(
知
识
洞察
大模型
教程
吴恩达Prompt教程之总结
图
解
本篇文章是前几篇文章的总结,一
图
胜千言,所以用如下的思维导
图
将吴恩达老师Prompt教程进行了梳理。
prompt
教程
吴恩达
Stable Diffusion
Stable Diffusion ControlNet:Reference“垫
图
”功能,不炼丹也能保持同一人物
+attn:仅参考输入
图
,自适应实例规范+Attention链接 reference_only:仅参考输入
图
,今天主要讲这个预处理器。
文生图
RAG
图
片拖拽神器DragGAN介绍及官方安装文档说明
拖放
图
像编辑是一项功能强大的技术,它涉及训练生成模型来根据用户提供的指令转换
图
像。
开源
ComfyUI
扣子更新
图
像流功能,字节版 ComfyUI 来了!
用户无需编程基础,即可通过创建节点的方式,搭建工作流,轻松部署使用复杂的 Stable Diffusion.如果你是研究 AI 生
图
的朋友,却不
知
道 ComfyUI,那就好比 Agent
ComfyUI
图像流
文生图
再也不用担心 AI
图
片脸崩手崩了
接着回到 WebUI 文生
图
或
图
生
图
的界面,就可以看见 ADetailer 出现在列表中啦。
ADetailer
安装
文生图
语音
语音
识
别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语音
识
别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
大模型
金融行业的开源AI大模型
而行业大模型,就像专业的本科生、研究生、博士生或者是行业从业人员,对自己领域的
知
识
能够快速理解,对业务能够迅速处理。
开源
大模型
一张
图
看懂IT人的江湖地位
一张图看懂IT人的江湖地位
工作
儿童
AI赋能实验室:儿童绘本插
图
含义解析: 此幻想艺术的儿童插
图
风格,描绘出一个充满好奇心和顽皮举止的动物角色,将要在一个活力四溢而又神秘的场所开启它的冒险旅程。
插画
文生图
Stable Diffusion
深入浅出学习Stable diffusion之线稿转效果
图
,T站,吐司 首先看一下成果:这是一个白膜
图
,当然你手绘也可以,以下以专业的景观设计方向为参考: 然后两秒出
图
: 当然这里还没有怎么调节VAE,多次尝试滤镜将达到更好的效果
Stable
Diffusion
文生图
大模型
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100