首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 高效选择:Ollama与LM Studio深度对比
· GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
· 使用ChatGPT润色出高品质文章!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· LLM应用架构之检索增强(RAG)的缘起与架构介绍
· Stable Diffusion 加速/优化/升级 优化出图速度
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
· 一个完整Prompt让ChatGPT自动生成短视频制作脚本
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
微软对 Sora 进行了逆向工程
分
析,揭秘 Sora 的秘密
Sora 的发展,标志着 AI 长期研究的一个里程碑:让 AI 系统(或 AI
智
能
体)不仅
能
理解复杂的用户指令,还
能
将这些理解应用于解决现实世界的问题,通过动态和情境丰富的模拟互动。
Sora
微软
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响
分
析
把不同格式的视频编码成统一的视觉块嵌入,然后用足够大的网络架构+足够大的训练批次(batch size)+ 足够强的算力,让模型对足够多的训练集做全局拟合(理解),在模型更好地还原细节的同时让模型出现
智
能
涌现
能
力
sora
openai
视频生成
工具
3.5k Star! 一
分
钟搭建一个属于你自己的开发工具箱!——It-tools
Web(网站)工具
类
,包含Url格式编码解码,用户代理解析器,网址解析器等15种不同的功
能
。
IT-TOOLS
开源模型
Sora
中学生
能
看懂:Sora 原理解读
为了让Sora
能
够像人
类
大脑那样理解和生成这么丰富的视觉内容,OpenAI开发了一套将这些不同
类
型视觉数据转换为统一表示形式的方法。
Sora
原理
语音
GLM-4-Voice 9B——实时多语言语音对话 AI——几
分
钟内即可在本地安装
介绍 近年来,语音启用的人工
智
能
取得了显著进展,使对话代理
能
够更好地理解和响应人
类
语言。
GLM-4-Voice
9B
语音
安装
Stable Diffusion
Stable Diffusion ControlNet:Reference“垫图”功
能
,不炼丹也
能
保持同一人物
ControlNet推出Reference(参考)控制
类
型也有一段时间了,最近体验了一下,被他的强大的效果震惊到了,之前一直想生成同一主体系列图片,需要Lora炼丹,这个不仅需要电脑有一定的配置,还要处理大量素材图片耗时耗力
文生图
大模型
智
谱AI大模型ChatGLM3-6B更新,快來部署体验
ChatGLM3 是
智
谱AI和清华大学 KEG 实验室联合发布的新一代对话预训练模型。
ChatGLM3-6B
开源模型
Transformer
图解 Transformer——功
能
概览
使得
类
GPT 系列这样的模型,不仅
能
理解和生成自然语言,还
能
在多种任务上表现出色,如文本摘要、问答、翻译等。
Transformer
大模型
图解
开源
「Agent」通俗易懂地聊聊AI Agent(附66个开源+44个闭源Agent项目)
想象一下人工
智
能
模仿人
类
的日常任务来处理大量人
类
的复杂社会行为。
大模型
LLM
从专业ASR到统一音频LLM:七大顶尖模型的深度对比
分
析
虽然其流式处理由FunASR工具包而非原生功
能
启用,但其一体化的特性简化了多任务音频
分
析应用的架构[5]。
音频
对比
Github
我去,找到一个Github上非常优秀的AI项目,可控制鼠标、键盘,模拟人
类
操作,太丝滑,收藏~~~
但它们依赖“API 文本输入输出”,迟迟无法控制本地界面,本地任务自动化仍然困难: 操作 Office、可视化软件受限 拆
分
复杂任务,难以形成闭环 缺乏视觉
能
力,仅凭语言无法定位
AI
Agent
开源项目
ChatGLM
可
能
是国产最强AI,ChatGLM-4来了!
在使用ChatGLM进行财报
分
析的时候,我发现效果并不比ChatDoc差,尤其是更新到GLM-4后,对财报中的报表数字非常敏感,结合我比较专业的提问,
能
非常容易的回复出我想要的重要知识点。
ChatGLM
智普
FaceFusion又更新咯,增强功
能
再增强!
换脸模型添加了FP16高性
能
版。
FaceFusion
文生图
儿童
AI赋
能
实验室:儿童绘本插图
此外,“raw”(原始)风格则可
能
意味着此插图保持了手绘的质感和温度,增加了作品的原创性和情感表达。
插画
文生图
Stable Diffusion
Stable Diffusion | SD的老舅ComfyUI来了,节点式工作流,
分
部控制出图
,用户可以精准的控制每个版块的设置,达到控制变量的目的,但节点式的工作流也提高了一部
分
使用门槛。
生成式AI
<
...
9
10
11
12
13
14
15
16
17
18
...
>
1
2
4
5
6
7
8
9
100