首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
语
音
、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音
识别模型,它是一种通用的
语
音
识别模型,可以用于
语
音
识别、
语
音
翻译和
语
言识别等任务。
人工智能
大模型
wisper
语
音
克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音
生
成
技术,不仅能可能声
音
,还能通过对声
音
的描述来生
成
独特的
音
色,同时还能通过描述来生
成
各种各样的
音
效,甚至能通过文字描述来编辑声
音
,整体来说,这项技术几乎囊括了现在人们对
语
音
生
成
技术的所有的需求
Meta
语音生成
开源
Chinese-LLM开源中文大
语
言模型
合
集
书生·浦
语
地址:https://github.com/InternLM/InternLM-techreport 简介:商汤科技、上海AI实验室联
合
香港中文大学、复旦大学和上海交通大学发布千亿级参数大
语
言模型
大模型
中文
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整
合
AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音
识别技术
这款最新的自动
语
音
识别模型不仅在多
语
言识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
AI+
音
乐|对话 Suno CEO:破圈的
音
乐生
成
产品是如何诞生的?
用户可以通过简单的文本提示进行创作,生
成
多种
音
乐风格的高质量
音
乐和
语
音
。。
suno
音乐
视频
栩栩如生,
音
色克隆,Bert-vits2文字转
语
音
打造鬼畜视频实践
BERT的出现对自然
语
言处理领域带来了重大影响,
成
为了许多最新研究和应用的基础。
Bert-vits
语音
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
与以往主要迎
合
单一类型的
音
频(如人声)的工作不同,或者专注于特定任务(如
语
音
识别和字幕),或者将模型限制在单一
语
言上,我们扩大了训练规模,涵盖了超过30个任务、八种
语
言和各种
音
频类型,以推进通用
音
频理解能力的发展
大模型
语音
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
大模型
苏秦(suqin)
语
言大模型全工具链 WebUI 整
合
包
项目简介 本项目目标是实现目前各大
语
言模型的全流程工具 WebUI 整
合
包。
大模型
工具
惊艳推荐!8款好用又免费的文本转
语
音
TTS工具
在早期,TTS技术主要依赖于预录制的声
音
样本,通过组
合
这些样本来生
成
语
音
。
TTS
Maker
语音
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
OpenAI
基于 OpenAI Whisper 模型的实时
语
音
转文字工具
,用于实时
音
频处理、效果制作和声
音
合
成
。
WhisperLive
音频
开源软件
打造
音
乐传奇:Suno推出
音
乐生
成
模型Suno V3,让每个人都能
成
为作曲家
用国内爆火的kimi生
成
歌词 在歌曲作词过程中,有许多专业术
语
和词汇用于描述不同的元素和技巧。
suno
歌曲
音乐
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100