首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI写作:爆款选题公式+Prompt指令,手把手教你写赚钱的公众号流量主文章
· 大模型评测新思路:弱智吧精华问题大全
· Dify:大模型创业开源工具,46,558 行代码,完全开源
· 会议纪要类提示词大全-最全会议纪要prompt
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 国产大模型与全球最强大模型大比拼:语义理解、数学推理同台竞技,究竟谁更厉害
· ChatGLM智谱清言
· 更快更好的chatglm3来了
· ComfyUI安装及生成第一张图
· 用 Stable Diffusion 10分钟实现电商模特换装/换模特
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
AI虚拟主播数字人技术实现Wav2Lip
本文主要实现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口
型
与
音
频中的
语
音
唇形同步)。
数字人
视频
微软
2.7B能打Llama 2 70B,微软祭出「小
语
言
模
型
」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
凭借着2.7B的参数,「小
语
言
模
型
(SLM)」Phi-2几乎打穿了所有13B以下的大
模
型
——包括谷歌最新发布的Gemini Nano 2。
小语言模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为
语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的
语
音
输出,实现
语
音
合成的功能 目前市场上的AI声
音
我们最多用的还是普通的
声音克隆
教程
大
模
型
的研究新方向:混合专家
模
型
(MoE)
随着不同应用场景的实际需求,大
模
型
的参数会变得越来越大,复杂性和规
模
不断的增加,尤其是在多
模
态大
模
型
的开发中,每个数据集可能完全不同,有来自文本的数据、图像的数据、
语
音
的数据等,包含不同的
模
式,特征和标注之间的关系可能也大有不同
MoE
大模型
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
今天介绍一个开源的完整的数字人项目:Fay Fay是一个完整的开源项目,包含Fay控制器及数字人
模
型
,可灵活组合出不同的应用场景:虚拟主播、现场推销货、商品导购、
语
音
助理、远程
语
音
助理、数字人互动、心理测评
Fay
开源项目
数字人
开源
阿里云开源通义千问多
模
态大
模
型
Qwen-VL,持续推动中国大
模
型
生态建设
8月25日消息,阿里云推出大规
模
视觉
语
言
模
型
Qwen-VL,一步到位、直接开源。
大模型
LLM
领域大
模
型
LLM训练Trick
问题一:进行领域大
模
型
预训练应用哪些数据集比较好?
垂直
训练
大模型
动作识别
模
型
有哪些
动作识别
模
型
主要有: · TWO-STREAM CNN:网络顾名思义分为两个部分,一部分处理RGB图像,一部分处理光流图像。
动作识别
模型
开源
MaskGCT:登上GitHub趋势榜榜首的TTS开源大
模
型
MaskGCT是一个两阶段
模
型
:在第一阶段,
模
型
使用文本预测从
语
音
自监督学习(SSL)
模
型
中提取的
语
义标记;在第二阶段,
模
型
基于这些
语
义标记预测声学标记。
MaskGCT
声音克隆
StableDiffusion
StableDiffusion
模
型
推荐系列(功能
型
)
前两天,我分享了SDXL的通用
模
型
,这些
模
型
不仅在生成高质量图像和艺术作品方面表现出色,搭配上LoRA
模
型
还能在多个领域发挥重要作用,尤其是在平面设计与UI设计领域。
StableDiffusion
文生图
StableDiffusion
StableDiffusion
模
型
推荐系列(全能
型
)
今天,我们要聊一聊AI绘画领域里的一个超有趣的话题:为什么Midjourney能用一个5.2
模
型
轻松驾驭各种风格,而Stable Diffusion却需要我们切换无数个
模
型
呢?
stablediffusion
sd
文生图
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
Pinokio,无脑一键部署主流AI
模
型
项目!
AI绘画
AI视频
AI音乐
大
模
型
量化:什么是
模
型
量化,如何进行
模
型
量化
What:什么是
模
型
量化 简单来说,
模
型
量化(Model Quantization)就是通过某种方法将浮点
模
型
转为定点
模
型
。
大模型
开源
[中文开源震撼首发]33B QLoRA大
语
言
模
型
Anima真的太强大了!QLoRA技术可能是AI转折点!
我们开源了第一个中文QLoRA 33B大
语
言
模
型
——Anima。
开源模型
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
内置HP2和HP3两个
模
型
,HP3可能轻微漏伴奏但对主人声保留比HP2稍微好一丁点; 2、仅保留主人声:带和声的
音
频选这个,对主人声可能有削弱。
数字人
声音克隆
GPT-SoVITS
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100