首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI虚拟主播数字人技术实现Wav2Lip
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· Suno音乐新手指南(手把手完整版教程)
· SD3 正式开源 Sora同源架构
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 一位芯片投资人的十年复盘:谁是中国的英伟达|AI光年
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
一个
产
品
经理的大模型观察、反思与预测
“没干过
产
品
经理的战略不是好AI布道师” 战略、
产
品
经理、运营 抖
音
百科、今日头条、飞书、识区、类Notion文档、Simeji日文输入法、头条国际化TopBuzz toB/toC
工作
开源
开源
语
音
大
语
言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
作为一种重要模态,
语
音
提供了超越文本的多样且复杂的信号,如人声中的情感、
语
调和意图,自然声
音
中的火车汽笛、钟声和雷声,以及
音
乐中的旋律。
大模型
语音
教程
GPTs使用指南 | 保姆级GPTs入门教程,0代码基础也能做AI
产
品
· 三、GPTs创建完成 上述操作完成后点击保存,恭喜你创造了自己的AI
产
品
,成为全球拥有GPTs应用的一员啦!
GPTs
入门教程
RAG
RAG 2.0来了,它能成为生
产
落地的福
音
吗?
RAG作为当前最流行、相对成熟的的LLM应用架构,受到了开发者的广泛关注,相关围绕RAG优化的技术层出不穷,但依旧难逃达不到生
产
应用要求的尴尬。
RAG
大模型
Insanely Fast Whisper:超快的Whisper
语
音
识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音
转录模型的超快速能力。
音频
Whisper
视频
栩栩如生,
音
色克隆,Bert-vits2文字转
语
音
打造鬼畜视频实践
语
音
素材和模型 首先我们需要渣渣辉和刘青云的原版
音
频素材,原版《扫毒》素材可以参考:https://www.bilibili.com/video/BV1R64y1F7SQ/。
Bert-vits
语音
解读wav2lip:探究
语
音
驱动唇部动作的技术原理!
本文将深入介绍一下wav2lip的技术原理和细节,了解它是如何实现
语
音
驱动唇部运动的!
wav2lip
语音
大模型
备案通过且面向公众开放的国
产
精
品
大模型汇总,附访问链接
今年(2023年)8月15日正式施行的《生成式人工智能服务管理暂行办法》要求每一个大模型企业的生成式AI
产
品
若想要“持证上岗”,就必须逐条核对是否符合这改办法的要求。
大模型
国产
开源
网易有道强力开源中英双
语
语
音
克隆
其中的
音
素(phonemes)可以这样得到: python frontend.py data/my_text.txt > data/my_text_for_tts.txt. 5.
语音
开源
开源
从声纹模型到
语
音
合成:
音
频处理 AI 技术前沿 | 开源专题 No.45
它包含了两个最先进的 AI 生成模型 (AudioGen 和 MusicGen) 的推理和训练代码,可以
产
生高质量
音
频。
AudioCraft
音频
开源
【开源项目】Flow Matching
语
音
合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音
合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
OpenAI
基于 OpenAI Whisper 模型的实时
语
音
转文字工具
· WhisperLive 是一款专注于
音
频处理和创作的开源软件,使用 OpenAI Whisper 模型将
语
音
输入转换为文本输出,可以用于转录麦克风的实时
音
频输入和预先录制的
音
频文件,为艺术家和
音
乐制作人提供了一个强大的平台
WhisperLive
音频
开源软件
生成式AI工作流#
产
品
经理和创业者的秘密武器
在我过去的文章里有说过,
产
品
经理是“帮助团队交付正确
产
品
给用户的人”。
AIGC
工作流
登顶的小熊猫模型出AI
产
品
了!3步10秒出一张海报,可免费商用
难怪网友惊呼,这杀死了海报制作比赛,它看上去没把Midjourney当竞
品
,而是要和Adobe和Canva一较高下。
图形设计生成器
文生图
开源
开源免费离线
语
音
识别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英文
语
音
辨识能力已达到人类水准的Whisper神经网络,且它亦支持其它98种
语
言的自动
语
音
辨识。
wisper
翻译
免费
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100