首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 「Agent」通俗易懂地聊聊AI Agent(附66个开源+44个闭源Agent项目)
· 无需翻墙,可合法使用的8款国内AI大模型产品
· 鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 还在手写Prompt?这几大网站让你秒找大模型提示词!
· AI Math Solver
· humanize.im
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里出品自动化视频剪辑工具FunClip!
FunClip的特色功能包括集成高精度的中文
ASR
模型、支持热词定制化、说话人识别,以及提供Gradio交互界面,大大简化了视频剪辑的复杂度。
FunClip
视频
阿里
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
语音识别(
ASR
)是指将人类的语音转换为文本的技术,然而,目前的语音识别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
GitHub:https://github.com/mli/autocut 项目采用的是 OpenAI 开源的自动化语音识别(
ASR
)系统,使用从网络收集的 68 万小时的多语言和多任务监督数据进行训练
开源模型
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
这个模型是在whisper的large-v2模型上针对中文进行了微调,以增强中文语音识别能力, Belle-whisper-large-v2-zh 在中国
ASR
基准测试(包括 AISHELL1、AISHELL2
Whisper
语音优化
开源
【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
WebUI 工具:集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(
ASR
)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。
语音克隆
开源模型
大模型
达摩院SPACE对话大模型:知识注入与知识利用
对话是对语言的高级应用,主要有以下几个特点: ①口语化,表述随意,不一定符合语法、句子不完整、噪音较多、有很多
ASR
错误。
大模型
大模型
AI+智能客服:大模型可落地的最成熟场景之一
无聊、同情、平静、烦恼、激动、嫌弃、懊悔、羞愧、解恨、犹豫、思念、感动、敬佩、心慌、低落、骄傲、心虚、羡慕、辱骂 ) 阿里小蜜团队 (2)智能语音技术 智能语音技术包括语音识别(
ASR
ai
客服
<
1
2
>
1
2
4
5
6
7
8
9
100