首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 好看的图片不知道怎么写提示词?用AI读出来
· PPT又又有新突破了!智谱AI代码流造PPT
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 剪映专业版智能补帧
· 吴恩达的ChatGPT提示工程师教程1-9集全
· 国产视频制作之光-可灵:提示词大全整理
· Suno音乐新手指南(手把手完整版教程)
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 中文开源OCR框架对比及介绍
· 详解 Diffusion (扩散) 模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
事实上,
训
练
数据的规模和质量不足,也正是许多视频生成模型研发者所面临的棘手问题。
可灵
快手
文生视频
开源
中文开源OCR框架对比及介绍
OCR性能(★★★) 这里基于github上
训
练
好的模型做测试,不进行二次
训
练
,不过项目里有提供
训
练
数据的百度网盘下载,有资源的同学可以自己跑跑看。
OCR
大模型
一个产品经理的大模型观察、反思与预测
:以GPT为例 State of GPT:OpenAI 联合创始人 Andrej Karpathy GPT模型技术原理和
训
练
过程 GPT
训
练
的四个主要阶段: 1.Pretrain 预
训
练
工作
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
此外,MagicPose模块可以被视为原始文本到图像模型的扩展/插件,而无需修改其预
训
练
的权重。
MagicPose
视频
数字人
教你用StableDiffusion设计AI数字人
▲ 工具对比
训
练
流程首先,为了达成“像”的目标,我们把模型
训
练
分为两步,一是人脸,再是身材。
文生图
教程
用so-vits-svc-4.1进行音色转换的极简教程!
主要是因为孙燕姿的音色独特,吐词清晰,网络上存在她的大量歌曲,非常便于
训
练
。
so-vits-svc
音色转换
教程
StableDiffusion
StableDiffusion模型推荐系列(全能型)
这些模型背后,可是有着大量时间和资源的投入,比如SD1.5版本,耗资高达60万美元进行
训
练
,其中的
训
练
时间更是以万来计算的!
stablediffusion
sd
文生图
视频
AI自动生成视频全流程干货
今天分享的是最近Get到的一个新技能,本来想给公司用AI制作视频的,然后参加了一个培
训
,学完了,但是我发现AI将文字生成视频的本质还是将现有的视频库的内容进行重组,并不能满足我们这个行业的要求,但是针对特定的一些
AI
视频
大模型
分析过688篇大模型论文,这篇论文综述了LLM的当前挑战和应用
此外,他们更关注基于文本数据
训
练
的模型。
开源模型
大模型
最透彻的大模型PPO原理和源码解读
希望可以帮助大家更具象地感受RLHF的
训
练
流程。
PPO
大模型
源码解读
开源
网易有道强力开源中英双语语音克隆
下载预
训
练
模型, 然后运行: mkdir -p outputs/style_encoder/ckpt mkdir -p outputs/prompt_tts_open_source_joint/ckpt
语音
开源
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
此外,在人脸重建的
训
练
过程中,只有在
训
练
的中后期才开始优化口型,导致前期监督信息缺乏。
wav2lip
语音
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
6.
训
练
定制:PaddleOCR支持用户根据自己的需求进行模型
训
练
和定制,满足特定场景下的OCR需求。
PaddleOCR
文字识别
AI颠覆的第一个体育赛道,来了
在
训
练
和比赛分析方面,AI技术也在发挥着重要作用。
体育
AI
Stable Diffusion
硬核解读Stable Diffusion(系列一)
比如谷歌的Imagen采用纯文本模型T5 encoder来提出文本特征,而SD则采用CLIP text encoder,预
训
练
好的模型往往已经在大规模数据集上进行了
训
练
,它们要比直接采用一个从零
训
练
好的模型要好
StableDiffusion
文生图
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100