首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 高级 RAG 技术——图解概览
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 扣子更新图像流功能,字节版 ComfyUI 来了!
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法
· ChatGLM智谱清言
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
GLM-4-Voice 9B——实时多语言语音对话 AI——几分钟内即可在本地安装
我们还将查看其
架
构,并提供访问网络演示的实用指南。
GLM-4-Voice
9B
语音
安装
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
扩散模型通过一个数学上的可靠
框
架
,利用 U-Net 技术将噪声转化为图像,这一过程中,U-Net 通过预测和减少每步的噪声来帮助这一转换。
sora
论文
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式
开
放
来围观初代教父唱《野狼disco》 之前全网刷屏的阿里明星项目 EMO 终于正式
开
放了!
EMO
阿里
全民演唱
RAG
检索增强生成 (RAG):What, Why and How?
RAG
架
构和管道包括三个主要阶段--数据准备、检索和生成。
检索增强
大模型
AI Comic Factory:AI(连环)漫画生成器
首先,该项目是
开
源
的,但需要多个组件来运行,包括前端、后端、LLM(大型语言模型)、SDXL等。
生成式AI
AnimateDiff 生成补间动画
AnimateDiff 该论文提出了一个实用的
框
架
,用于为现有的文本生成图像模型添加动画效果。
文生图
AnimateDiff
ChatGPT
10个值得收藏的ChatGPT辅助编程技巧
如上所述,“提示”可能会生成答案或代码片段,这些答案或代码片段可能会引用较旧的
框
架
版本或具有安全缺陷或错误的已弃用功能。
编程
提示词
chatgpt
阿里
阿里Qwen3系列模型惊艳亮相
Qwen3模型依旧采用宽松的Apache2.0协议
开
源
,这意味着全球的
开
发者、研究机构和企业都能免费在HuggingFace、魔搭社区等平台下载模型,还能用于商业用途。
阿里
Qwen3
大模型
在飞速发展的时代管理AI风险
然而,公司正竞相创建与人类在大多数认知工作中匹敌或超越的通用人工智能系统,他们正迅速部署更多资
源
并
开
发新技术以提高人工智能能力。
人工智能
伦理
语音
「语音识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
作为Whisper模型的蒸馏版,Distil-Whisper凭借轻量级
架
构和卓越的处理速度,成为了技术热潮中的新宠。
Distil-Whisper
语音识别
ComfyUI
ComfyUI学习笔记2,一文看透Workflow
如上图,当运行到采样器在工作时,采样器KSampler节点的绿色
框
高亮,此时正对应着命令行窗口中的生成进度。
comfyui
文生图
GGUF格式详解
大语言模型的
开
发通常使用PyTorch等
框
架
,其预训练结果通常也会保存为相应的二进制格式,如pt后缀的文件通常就是PyTorch
框
架
保存的二进制预训练结果。
GGUF
大模型
工具
惊艳推荐!8款好用又免费的文本转语音TTS工具
该项目是
开
源
的,后端依赖于微软的Azure语音模型。
TTS
Maker
语音
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
幻觉“黑匣子”——很难理解大语言模型在得出结论时考虑了哪些数据来
源
。
检索增强生成
大语音模型
Sora
中学生能看懂:Sora 原理解读
这种方法的灵感来
源
于处理静态图像的技术,其中图像被分成小块以便于更有效地处理。
Sora
原理
<
...
29
30
31
32
33
34
35
36
37
38
...
>
1
2
4
5
6
7
8
9
100