首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 盘点字节跳动最新的AI应用
· 迄今为止,最强ChatGPT写论文技巧,总共6步,手把手告诉你!
· AI国力战争:GPU是明线,HBM是暗线
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 产品经理必会的3大流程:业务流程、功能流程、页面流程(附案例)
· 从零开始了解AI大模型 - 技术篇:万字深度好文人话说大模型技术
· 大模型应用中大部分人真正需要去关心的核心——Embedding
· 大模型推理能力增强方法总结
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
通过声
音
生成逼真的全身形象?!Meta开源AI
工
具
:audio2photoreal
这是一个由Facebook研究院开发的技术,可以根据
音
频生成逼真的人物视频!
audio2photoreal
开源工具
字正腔圆,万国同
音
,coqui-ai TTS跨
语
种
语
音
克隆,钢铁侠讲16国
语
言
按照固有的思维方式,如果想要
语
音
克隆首先得有克隆对象
具
体的
语
言
语
音
样本,换句话说,克隆对象必须说过某一种
语
言的话才行,但现在,coqui-ai TTS V2.0版本做到了,真正的跨
语
种无需训练的
语
音
克隆技术
coqui-ai
TTS
语音
Prompt
Prompt提示优化
工
具
下面汇总了一些Prompt
工
具
,可以辅助日常Prompt的编写。
prompt
提示词
开源
阿里巴巴
语
音
实验室发布开源
语
音
处理框架ClearerVoice-Studio,支持
语
音
增强、分离、目标说话人提取
.01 概述 在日常生活和
工
作中,你是否常因嘈杂的环境、重叠的对话或
音
视频信号的混杂而感到沟通困难?
ClearerVoice-Studio
语音
TTS,一个奇妙的AI
工
具
简介 TTS是一个将文本变换成
语
音
的AI
工
具
。
TTS
文本转语音
实时
语
音
克隆
项目简介 这份内容介绍了实时
语
音
克隆的技术实现,作者通过将说话者验证技术转移到多说话人文本到
语
音
合成(SV2TTS)来实现
语
音
克隆。
语音
克隆
开源
十大开源
语
音
识别项目
这些项目不仅在
语
音
技术领域
具
有重要意义,而且为
语
音
识别应用的发展提供了有力的支持。
语音识别
开源项目
20款AI
工
具
助力在家副业
通过与AI进行面试练习 4 MyHeritage Reimagine 扫描修复或将日照片动画化的服务 5 Liffery 你的个人人
工
智能研究助手 6 Gamma 使用人
工
智能来帮助塑造您的
工作
开源
语
音
、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音
识别模型,它是一种通用的
语
音
识别模型,可以用于
语
音
识别、
语
音
翻译和
语
言识别等任务。
人工智能
大模型
wisper
换脸
AI换脸
工
具
:facefusion使用心得
下面是不同模型的用途说明(
具
体查阅了chatGPT4和Gemini): 1.
FaceFusion
文生图
语
音
克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音
生成技术,不仅能可能声
音
,还能通过对声
音
的描述来生成独特的
音
色,同时还能通过描述来生成各种各样的
音
效,甚至能通过文字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生成技术的所有的需求
Meta
语音生成
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识别技术
这款最新的自动
语
音
识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
视频
Wunjo AI: 合成和克隆英
语
/俄
语
/中文
语
音
,实时
语
音
识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
多
语
言支持:目前支持英
语
、俄
语
、中文的
语
音
克隆(来自任何
语
言的
音
频)以及英
语
、俄
语
合成,并计划扩展西班牙
语
的
语
音
克隆合成模型。
AI语音克隆
实时语音识别
提示词
AIGC
工
具
提示词技巧
而现在,给机器或者程序一个
具
体指令,比如背景、原因、想要的结果等,需要用结构化
语
言告诉模型。
AIGC
提示词
阿里
阿里的AI一键换衣(AnyDoor)
工
具
来了
不过,这个功能实际操作起来还是比较麻烦的,近日阿里和港大推出了一个
工
具
,可以轻松实现一键换衣,当然,这个
工
具
不仅仅换衣那么简单,还可以把任意一张图片里的元素,毫无违和感的转移到另外一张图片,很像哆啦A梦里的任意门
AnyDoor
换装
文生图
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100