首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Midjourney AI 绘画美女提示词分享一
· 交友神器!AI二维码终极教程,3步做出你的专属艺术二维码!
· Suno音乐新手指南(手把手完整版教程)
· 盘点字节跳动最新的AI应用
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
· 颠覆数据存储方式:向量数据库的威力
· 主流向量数据库一览
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
工具
动画制作工具AnimateDiff用法详解
AnimateDiff 使用Stable Diffusion模型将文本提示转换为
视
频
。
AnimateDiff
视频
训练
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生成产品是如何诞生的?
包括拥有哈佛物理学博士学位的Mikey Shulman在内的创始人都是
音
乐家,他们将Suno
视
为解决
音
乐听众与创作者之间数量不平衡的工具。
suno
音乐
RVC和SVC声
音
模型难找?推荐这个网站
本篇文章介绍:1, 声
音
数据集训练到模型的过程 2 ,SVC和RVC声
音
模型网站推荐 一、声
音
数据集训练到模型的过程 AI声
音
模型训练是通过分析大量
音
频
数据来学习声
音
特性,生成与目标声
音
相似的新
音
频
声音克隆
数字人
人工智能
6个AI
音
乐软件推荐,让你学会人工智能AI作曲
这款AI
音
乐生成器支持为任何
视
频
或游戏创作
音
乐,它还附带一个免版税的
音
乐生成器,以避免与授权有关的问题。
训练
音乐
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
它可用于转录来自麦克风的实时
音
频
输入和预先录制的
音
频
文件。
OpenAI
Whisper
大模型
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
选择喜欢的
音
频
片段,并上传一张大头照。
音频
阿里
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语
音
识别数倍加速
前段时间,「霉霉大秀中文」的
视
频
在各个社交媒体走红,随后又出现了「郭德纲大秀英语」等类似
视
频
。
语音
HeyGen
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
,即便通过
视
频
扩展等手段,最多也只能生成十几秒的
视
频
。
视频生成
sora
工具
AI文本转语
音
工具(TTS):MeloTTS
今天给大家介绍一个效果不错的开源文本转语
音
工具:MeloTTS MeloTTS是一个可以把文字转换成声
音
的工具,它支持英语、西班牙语、法语、中文、日语和韩语等多种语言。
MeloTTS
语音工具
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
采用Video2Motion,基于
视
频
人物动作驱动3D数字人;人物唱演
视
频
生成框架Emote Portrait Alive能够基于单张图和
音
频
,输出准确、生动的人物唱演
视
频
。
通义
文生视频
开源
开源语
音
大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
使LLMs能够感知和理解丰富的
音
频
信号以进行
音
频
交互引起了广泛关注。
大模型
语音
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
OpenVoice 只需要来自目标说话者的简短
音
频
样本即可准确复制其独特的声调和特征。
OpenVoice
声音克隆
开源
OpenAI
基于 OpenAI Whisper 模型的实时语
音
转文字工具
今天给大家分享一款专注于
音
频
处理和创作的开源软件【WhisperLive】 什么是 WhisperLive?
WhisperLive
音频
开源软件
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
音
频
克隆的开源项目很多,但是每次项目里要用的时候,总还是惦记着11labs的api。
F5-TTS
音频克隆
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100