首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ComfyUI
必看!ComfyUI故障应对指南,让您轻松应对每
一
个挑战
ComfyUI的常见故障和解决,赶紧收藏起来, 在探索ComfyUI的曲折旅途中,最让人
心
生畏惧的莫过于那漫天的红色方框和层出不穷的报错信息。
ComfyUI
故障应对
数字人
AI虚拟主播数字人技术实现Wav2Lip
本
文
主要实现图片说话(如下图的蒙娜丽莎)、视频融合语音(这里的核
心
都是人物口型与音频中的语音唇形同步)。
数字人
视频
ComfyUI
入坑必看:comfyui界面与基础操作
如果你是comfyui的新手,不用担
心
,这篇
文
章将带你快速掌握其基础操作。
comfyui
文生图
AI绘画:InstantID
一
键运行包和在线Colab脚本!
下载到本地后,用解压软件解压,最好是解压到全英
文
的路径下,以防万
一
,少走弯路。
InstantID
文生图
CodeGeeX:Tab
一
下,代码自动生成
(相关链接,见
文
末)
一
、原理 模型 CodeGeeX是
一
个基于transformers的大规模预训练编程语言模型。
大模型
数据库
向量数据库不是
一
个单独的数据库分类
其中包括图数据库、关系数据库、
文
档数据库以及键值数据库,甚至还包括缓存。
大模型
向量数据库
OpenAI
AI Agents大爆发:软件2.0雏形初现,OpenAI的下
一
步
该过程将在有监督条件下进行微调,数据
格
式为 tn=(x,zi,yi,zj,...
agent
ComfyUI
用ComfyUI整了
一
套照片转Q版手办的工作流
在收集了
一
波好的功能和工作流之后就开始搞起来了。
comfyui
文生图
Stable Diffusion
硬核解读Stable Diffusion(系列
一
)
SD是
一
个基于latent的扩散模型,它在UNet中引入text condition来实现基于
文
本生成图像。
StableDiffusion
文生图
工具
TTS,
一
个奇妙的AI工具
简介 TTS是
一
个将
文
本变换成语音的AI工具。
TTS
文本转语音
Prompt
一
种通用的 Prompt 框架 - CRISPE
它包括设计提示,引导模型生成特定的语调、风
格
或内容类型。
Prompt
提示词工程
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核
心
模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
整体项目的框架如下: 核
心
模型
一
: 语音识别模型SenseVoice介绍 SenseVoice 是
一
个全面的语音基础模型,旨在执行各种语音理解任务,包括自动语音识别(ASR)、语言识别
asr
tts
声音
开源
书生·万卷:难得的中
文
开源数据集
中国的AI产业要迎头赶上,中
文
的数据集是最大的短板之
一
。
大模型
大模型
语言大模型100K上下
文
窗口的秘诀
上下
文
窗口(context window)是指语言模型在进行预测或生成
文
本时,所考虑的前
一
个词元(token)或
文
本片段的大小范围。
大模型
开源
语音、视频转
文
字神器:开源whisper介绍
OpenAI的Whisper是
一
种基于深度学习的语音识别模型,它是
一
种通用的语音识别模型,可以用于语音识别、语音翻译和语言识别等任务。
人工智能
大模型
wisper
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100