首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13个神级Chatgpt指令,助你小说丝滑过审
· Suno音乐新手指南(手把手完整版教程)
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 阿里云王坚:中国AI不惧R2迟发!靠「群体智能」破局:算力不是瓶颈,但AI应用层急需炸开OpenAI想象围墙!不看好硅谷抢人乱象
· 造梦师手记:C站最受欢迎的大模型推出了SFW版
· AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
· AI写作不如意?万字长文深度剖析背后原因
· 大模型的研究新方向:混合专家模型(MoE)
· 喂饭级 AI’MWISE 启动器安装教程
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
, '日语男', '粤语女', '英文女', '英文男', '韩语女'; 运行结果:对应合成的音
频
效果展示: sft_中文女代码合成,z先生的备忘
录
,31秒 粤语女声案例展示
asr
tts
声音
语音
关于AI声音生成的一切(语音+音乐+嘴型)
2D/3D/视
频
生成最近都有很多值得关注的工具,但是要输出完整的AIGC作品,肯定少不了声音。
声音
AI拟声: 5秒内克隆您的声音
你可以使用它来
录
制自己朗读的课文或常用单词,然后反复听取以加深记忆和练习口语。
声音克隆
开源
Github
我去,找到一个Github上非常优秀的AI项目,可控制鼠标、键盘,模拟人类操作,太丝滑,收藏~~~
通用目标:支持任意本地软件(如游戏、Office、图像/视
频
编辑工具) 多模态输入:以截图为输入,支持键盘鼠标操作输出 自主能力:内置“认知反思+技能更新”模块,能不断自我优化 模块化设计
AI
Agent
开源项目
数字人
划重点!全网最全AI数字人工具合集!
· 选择语音:输入文字或
录
制语音,让数字人“说出”你想让他/她表达的内容。
AI
数字人
Stable Diffusion
回来啦 | Stable Diffusion 图片背景完美替换
在广告产品图、头像背景替换、图片后期处理等场景下用到的都很
频
繁。
Stable
Diffusion
文生图
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
其核心功能是通过提供发言者的短音
频
片段(参考语音),实现声音的高效克隆。
tts
文本转语音
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
这意味着它能够同时处理多个音
频
片段,大幅缩短了从语音到文本的转换时间。
Whisper
语音识别
AI生成卡通人物项目|VToonify
在本文中,我们通过引入一种新颖的 VToonify 框架来研究具有挑战性的可控高分辨率肖像视
频
风格转移。
AI生成卡通人物
VToonify
换脸
Roop升级版FaceFusion换脸AI技术使用以及部署教程
首先我们需要确认一个工作目
录
,用来存放facefusion的相关环境依赖文件。
FaceFusion
教程
换脸
换脸软件 FaceFusion 保姆级教程
FaceFusion 是由 Roop 项目的核心开发者独立发布的,它被官方描述为下一代的人脸交换和增强软件,这个软件可以用于处理图片和视
频
,可以运行在 GPU 和 CPU 下面。
FaceFusion
教程
大模型
从零开始学习大模型-第二章-大模型学习路线
随着技术的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视
频
。
大模型
学习
教程
用so-vits-svc-4.1进行音色转换的极简教程
其实歌声转换不仅仅适用于歌声,普通讲话也可以,只是歌唱的音调基本能覆盖到低、中、高全域声音类型,而正常说话可能无法做到全域覆盖,但是如果在
录
制声音的时候能够做到覆盖多种音调类型,也可以实现声音转换。
声音
sovits
金融
金融行业的AIGC应用
在面向企业的应用中,其在风险评估和信用分析方面能够深度解析财务报告和信用记
录
,助力精确评估信用风险。
金融
大模型
开源
精通百种语言的翻译AI来了!Meta推出,免费、开源!
这个模型可以实现近101种语言之间的文本、音
频
、视
频
等多种形式的翻译,而且只需要一个模型就可以完成所有任务。
大语言模型
<
...
6
7
8
9
10
11
12
13
14
15
...
>
1
2
4
5
6
7
8
9
100