首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· GenColor.ai
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Stable Diffusion 30种采样器全解!
· RVC和SVC声音模型难找?推荐这个网站
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 全新换脸工具ReActor,比roop更强!
· 关于AI声音生成的一切(语音+音乐+嘴型)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
事实上,
训
练
数据的规模和质量不足,也正是许多视频生成模型研发者所面临的棘手问题。
可灵
快手
文生视频
开源
中文开源OCR框架对比及介绍
OCR性能(★★★) 这里基于github上
训
练
好的模型做测试,不进行二次
训
练
,不过项目里有提供
训
练
数据的百度网盘下载,有资源的同学可以自己跑跑看。
OCR
StableDiffusion
StableDiffusion模型推荐系列(全能型)
这些模型背后,可是有着大量时间和资源的投入,比如SD1.5版本,耗资高达60万美元进行
训
练
,其中的
训
练
时间更是以万来计算的!
stablediffusion
sd
文生图
视频
AI自动生成视频全流程干货
今天分享的是最近Get到的一个新技能,本来想给公司用AI制作视频的,然后参加了一个培
训
,学完了,但是我发现AI将文字生成视频的本质还是将现有的视频库的内容进行重组,并不能满足我们这个行业的要求,但是针对特定的一些
AI
视频
开源
国内外开源大语言模型一览表
同时开源预
训
练
和对齐模型:预
训
练
模型是适用开发者的『 基座 』,而广大普通用户对有对话功能的对齐模型具有更强的需求。
大模型
开源
截至2023年5月份业界支持中文大语言模型开源总结及商用协议分析
BLOOM的
训
练
语料第一大语言是英语,占比30.4%,其次就是中文,占比16.2%。
大模型
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
此外,MagicPose模块可以被视为原始文本到图像模型的扩展/插件,而无需修改其预
训
练
的权重。
MagicPose
视频
大模型
最透彻的大模型PPO原理和源码解读
希望可以帮助大家更具象地感受RLHF的
训
练
流程。
PPO
大模型
源码解读
开源
网易有道强力开源中英双语语音克隆
下载预
训
练
模型, 然后运行: mkdir -p outputs/style_encoder/ckpt mkdir -p outputs/prompt_tts_open_source_joint/ckpt
语音
开源
大模型
分析过688篇大模型论文,这篇论文综述了LLM的当前挑战和应用
此外,他们更关注基于文本数据
训
练
的模型。
开源模型
AI颠覆的第一个体育赛道,来了
在
训
练
和比赛分析方面,AI技术也在发挥着重要作用。
体育
AI
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
此外,在人脸重建的
训
练
过程中,只有在
训
练
的中后期才开始优化口型,导致前期监督信息缺乏。
wav2lip
语音
Stable Diffusion
硬核解读Stable Diffusion(系列一)
比如谷歌的Imagen采用纯文本模型T5 encoder来提出文本特征,而SD则采用CLIP text encoder,预
训
练
好的模型往往已经在大规模数据集上进行了
训
练
,它们要比直接采用一个从零
训
练
好的模型要好
StableDiffusion
文生图
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
6.
训
练
定制:PaddleOCR支持用户根据自己的需求进行模型
训
练
和定制,满足特定场景下的OCR需求。
PaddleOCR
文字识别
ChatGLM
手把手带你微调一个自己的 ChatGLM2-6B 模型
ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预
训
练
与人类偏好对齐
训
练
,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、
ChatGLM2-6B
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100