首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 万字长文,AI大模型的应用实践总结
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· ComfyUI 基础教程(一)环境部署和插件安装
· 备案通过且面向公众开放的国产精品大模型汇总,附访问链接
· 保姆级教程:Coze 打工你躺平
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI安装及生成第一张图
· Stable Diffusion 喂饭教程来啦!价值上万的模特AI换装方法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口
型
与
音
频中的
语
音
唇形同步)。
数字人
视频
教程
AI声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为
语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的
语
音
输出,实现
语
音
合成的功能 目前市场上的AI声
音
我们最多用的还是普通的
声音克隆
教程
大
模
型
的研究新方向:混合专家
模
型
(MoE)
随着不同应用场景的实际需求,大
模
型
的参数会变得越来越大,复杂性和规
模
不断的增加,尤其是在多
模
态大
模
型
的开发中,每个数据集可能完全不同,有来自文本的数据、图像的数据、
语
音
的数据等,包含不同的
模
式,特征和标注之间的关系可能也大有不同
MoE
大模型
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
今天介绍一个开源的完整的数字人项目:Fay Fay是一个完整的开源项目,包含Fay控制器及数字人
模
型
,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、
语
音
助理、远程
语
音
助理、数字人互动、心理测评
Fay
开源项目
数字人
开源
MaskGCT:登上GitHub趋势榜榜首的TTS开源大
模
型
MaskGCT是一个两阶段
模
型
:在第一阶段,
模
型
使用文本预测从
语
音
自监督学习(SSL)
模
型
中提取的
语
义标记;在第二阶段,
模
型
基于这些
语
义标记预测声学标记。
MaskGCT
声音克隆
开源
阿里云开源通义千问多
模
态大
模
型
Qwen-VL,持续推动中国大
模
型
生态建设
8月25日消息,阿里云推出大规
模
视觉
语
言
模
型
Qwen-VL,一步到位、直接开源。
大模型
LLM
领域大
模
型
LLM训练Trick
问题一:进行领域大
模
型
预训练应用哪些数据集比较好?
垂直
训练
大模型
动作识别
模
型
有哪些
动作识别
模
型
主要有: · TWO-STREAM CNN:网络顾名思义分为两个部分,一部分处理RGB图像,一部分处理光流图像。
动作识别
模型
StableDiffusion
StableDiffusion
模
型
推荐系列(功能
型
)
前两天,我分享了SDXL的通用
模
型
,这些
模
型
不仅在生成高质量图像和艺术作品方面表现出色,搭配上LoRA
模
型
还能在多个领域发挥重要作用,尤其是在平面设计与UI设计领域。
StableDiffusion
文生图
StableDiffusion
StableDiffusion
模
型
推荐系列(全能
型
)
今天,我们要聊一聊AI绘画领域里的一个超有趣的话题:为什么Midjourney能用一个5.2
模
型
轻松驾驭各种风格,而Stable Diffusion却需要我们切换无数个
模
型
呢?
stablediffusion
sd
文生图
开源
[中文开源震撼首发]33B QLoRA大
语
言
模
型
Anima真的太强大了!QLoRA技术可能是AI转折点!
我们开源了第一个中文QLoRA 33B大
语
言
模
型
——Anima。
开源模型
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
Pinokio,无脑一键部署主流AI
模
型
项目!
AI绘画
AI视频
AI音乐
大
模
型
量化:什么是
模
型
量化,如何进行
模
型
量化
What:什么是
模
型
量化 简单来说,
模
型
量化(Model Quantization)就是通过某种方法将浮点
模
型
转为定点
模
型
。
大模型
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
内置HP2和HP3两个
模
型
,HP3可能轻微漏伴奏但对主人声保留比HP2稍微好一丁点; 2、仅保留主人声:带和声的
音
频选这个,对主人声可能有削弱。
数字人
声音克隆
GPT-SoVITS
图解大
模
型
训练之:张量
模
型
并行(TP),Megatron-LM
今天我们将要介绍最重要,也是目前基于Transformer做大
模
型
预训练最基本的并行范式:来自NVIDIA的张量
模
型
并行(TP)。
开源模型
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100