首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 分享一个结构化AI提示词模版
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· MiniCPM 4.1 开源!代码、数学推理速度快了 3 倍!
· ChatGLM智谱清言
· 完整ChatGLM3部署教程,支持手机和车载平台部署
· 中文通用大模型评测基准发布,全方位解析评价维度,助你选出最优秀的模型!
· 用Midjourney给自己制作精美的logo或头像
· 和大模型相关的一些术语(持续更新中)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
【TTS语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
(TTS): 输入 5 秒的
声
音
样本,即刻体验文本到语
音
转换。
语音克隆
开源模型
ChatGPT
为什么国产大模型都说超越ChatGPT而体验却很拉?警惕 Goodhart law 陷阱
最近不少国产大模型
声
称,他们的表现甚至超越了业界知名的ChatGPT模型。
ChatGPT
国产大模型
人工智能
2023年人工智能行业总结
而变
声
模型vits和文本转语
音
TTS的发展,也让GPT有了耳朵和嘴巴。
人工智能
AGI
思考总结
视频
图文生成短视频的方法
然后,在进入「导入剪辑」中,把所有自己需要的素材替换掉,记得关闭原
声
哈。
视频
ChatGPT
数字人
这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
语
音
助理和远程语
音
助理:数字人可以作为语
音
助理,进行语
音
交互,提供信息查询、日程管理等辅助任务。
Fay
开源项目
数字人
教你打造属于自己的AI孙燕姿,AI歌手模型使用及训练保姆级课程 #1/2 使用模型
原始
声
音
处理 要使用模型进行推理的话你首先需要一段已经演唱好的
声
音
垫进去,然后使用模型把原来的
音
色换成你模型训练好的
音
色(类似AI画图的img2img垫图)。
生成式AI
《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
无论看还是不看这些短剧的,都是吐槽
声
一片,因为剧情过于反智雷人,但又让一部分人忍不住想看看后面到底还有啥剧情。
短剧
人工智能
2023年人工智能行业总结(精简版)
年初的vits项目能完美模拟人的
声
音
特点,AI孙燕姿能唱周杰伦的歌。
人工智能
行业总结
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
零样本 & 小样本 TTS:输入 10 到 30 秒的
声
音
样本即可生成高质量的 TTS 输出。
Fish
Speech
本地搭建
LLM
基于LLM+向量库的文档对话痛点及解决方案
痛点:文档切分粒度不好把控,既担心噪
声
太多又担心语义信息丢失 笔者之前采用了Longchain的文档切分工具,发现不能问题。
开源模型
开源
3 分钟,把一篇 3000 字长文变成“脱口秀”——开源神器 Twocast 实战指南
复制粘贴就行,不用排版 内置 3 大 TTS 引擎 Fish
声
音
最自然
Twocast
开源
Roop参数说明,ROOP->StyleGAN演示!
保留
音
轨(keep audio)
音
轨就是指视频的
声
音
,勾选这个参数就是保留原视频的
声
音
,大部分情况下,肯定是要选择启用。
视频
StyleGAN
Stable Diffusion
SD入门教程一:Stable Diffusion 基础(技术篇)
),顾名思义,它就是能预测出随机图里包含什么噪
音
的模型。
Stable
Diffusion
文生图
开源
搞了一个Dify开源知识库
Workflow:打造你的智能工作流 · 初衷:也是在机缘巧合下,感谢MAX和众多大佬的呼
声
支持下
Dify
大模型
知识库
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
多模态(Multi-Modal): 多模态主要是指让机器能够理解和处理自然界或人工定义的多种模态信息,如
声
音
、语言、视觉信息和表格、点云信息等。
开源
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100