首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· MCP服务介绍及应用场景报告-来自Manus
· 为你推荐开源项目:Meridian——专属个人情报站!
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· AI换脸工具:facefusion使用心得
· ChatGLM智谱清言
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
再也不用担心 AI 图片脸崩手崩了
处
理
完成之后,图片就出来了。
ADetailer
安装
文生图
Agent
AI Agent / 智能体观察笔记(下)
用户给GPT输入目标后,智能体会给用户整
理
一个任务清单。
大模型
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
它提供了模型管
理
检索、模型下载、模型调优和训练模型推
理
。
开源
ComfyUI
ComfyUI 基础教程(一)环境部署和插件安装
1.辣椒酱的界面汉化:该插件可以汉化ComfyUI的界面,使中文用户更容易
理
解和操作。
comfyui
文生图
吴恩达老师建议大家关注 AI 智能体工作流
通过采用智能体工作流,我们可以引导大语言模型对文档进行多轮迭代处
理
,仿佛它在多次精细打磨它的作品。
智能体
大语言模型
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!!
Phi-3 Mini AI模型,在包括语言
理
解、逻辑推
理
、编程和数学在内的一系列基准测试中表现卓越,超越了大量参数高达数百亿的竞争模型。
Phi-3
Mini
人工智能
Sora
通俗易懂地解释OpenAI Sora视频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
OpenAI Sora涌现出真实物
理
世界模拟的能力 OpenAI Sora可以生成更加真实的物
理
世界的视频。
sora
视频生成
Stable Diffusion
Stable Diffusion 快速创作角色三视图
一 流程介绍 整个流程原
理
很简单,我们通过使用 ControlNet Openpose 模型根据我们上传的三视图骨骼图进行渲染。
SD
三视图
文生图
阿里
[论文] 阿里提出AgentScope:灵活强大的智能体框架
管
理
和包装层(Manager and Wrapper Layer):作为中介,管
理
和包装抽象层管
理
资源和 API 服务,确保资源的高可用性,并提供抵抗 LLMs 不良响应的能力。
AgentScope
语言大模型
智能体
Agent
AI Agent / 智能体观察笔记(上)
02 — AI Agent的工作原
理
理
解目标:用户给到智能体一个目标后,智能体首先会使用如GPT在内的大语言模型去
理
解目标——明白自己要干嘛;
大模型
OpenAI
Ilya认错,Scaling Law崩了?自曝SSI秘密技术路线取代OpenAI
测试时计算技术,能在推
理
阶段(模型被使用时)就将模型增强,比如,模型可以实时生成和评估多种可能性,而不是
理
解选择单一答案。
Scaling
Law
AI大模型
大模型
比GPT-4快18倍,世界最快大模型Groq登场!每秒500 token破纪录,自研LPU是英伟达GPU 10倍
Groq突然爆火,背后最大的功臣不是GPU,而是自研的LPU——语言处
理
单元。
Groq
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速训练并实现实时因素(RTF)0.15的推
理
速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
AnimateDiff 生成补间动画
主要的实现原
理
: 1 通过controlnet的tile来处
理
2 设置timestep_keyframe控制每一帧controlnet的权重
文生图
AnimateDiff
LLM
收藏!万字长文聊聊LLM Agents的现状,问题与未来
其机
理
分别于类似于人类用眼睛耳朵等获得信息,用大脑用于处
理
信息和驱动四肢,用四肢改变环境和改变人类自身。
LLM
Agents
<
...
33
34
35
36
37
38
39
40
41
42
...
>
1
2
4
5
6
7
8
9
100