首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 中文开源OCR框架对比及介绍
· TrOCR——基于transformer模型的OCR手写文字识别
· AI换脸工具:facefusion使用心得
· Coze多智能体(Multi-Agents)模式体验!
· 十大开源语音识别项目
· 绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
· 强大高效的微信爬虫Wechat_Articles_Spider:快速获取公众号文章的利器
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 交友神器!AI二维码终极教程,3步做出你的专属艺术二维码!
· AI绘画:stable difussion SD插件之 无限抽卡神器 dynamic prompts(动态提示词)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
6.2K Star!MIT出品的多语言语
音
合成神器,CPU实时推理吊打商业软件!
Bert的加入让语
音
的韵律和情感表达更自然。
MeloTTS
语音工具
开源
OpenAI真的开源了!这波「实时语
音
」操作,让万物开口说话,我爱了
以前,智能玩具里只能播放预设的程序和声
音
,顶多就是进行一两轮简单提问,你可以理解成是“单向输出”,现在有了这个 openAI 的实时语
音
软件开发包,就变成了“双向交互”,能和你进行实时的语
音
对话。
OpenAI
嵌入式实时语音
SDK
工具
TTS,一个奇妙的
AI
工具
简介 TTS是一个将文本变换成语
音
的
AI
工具。
TTS
文本转语音
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
字节跳动最近推出了一款名为PersonaTalk的
AI
模型,这项黑科技让视频配
音
彻底摆脱了传统的“僵硬感”。
PersonaTalk
视频
数字人
SadTalker数字人常见问题3
SadTalker数字人制作工具,用自带的图片
音
频可以生成,而用自己的图片、
音
频生成视频就不行。
SadTalke
用
AI
生成PPT、用
AI
优化PPT
我在前几天写过相关文章,当时我在文中引用的是百度
AI
对话的PPT生成插件,我对这个插件生成的PPT的评价不高,但是在体验了百度文库的智能PPT功能后,有种“识别三日,当刮目相看”百度的感觉。
ppt
AI生成PPT
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将语
音
输入转换为文本输出。
OpenAI
Whisper
大模型
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的
音
频驱动唇部同步模型。
MuseTalk
数字人
音频
用GPT4创建一部连环画故事
今天的故事主题是戒掉电子产品,享受户外活动的
乐
趣。
GPT4
连环画故事书
语
音
识别的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语
音
识别的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
生成式
AI
与大语言模型的区别
生成式人工智能可以被定义为专注于创建具有生成原创内容能力的模型,例如图像、
音
乐
或文本。
生成式AI
大语言模型
区别
视频
图文生成短视频的方法
现在都是使用
AI
创作的时代,你完全可以把你想要表达的主题,用
AI
生成一个爆款的视频文案。
视频
ChatGPT
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/
音
频/文本
对于
音
频对齐,作者收集了开源和内部的数据集,用于自动语
音
识别(ASR)和
音
频问答(AQA)。
Baichuan-Omni
多模态大模型
开源
开源即巅峰!微软VibeVoice 7B模型:跨语言、多说话人、长文本一次到位
(五)高保真
音
频 VibeVoice生成的语
音
质量高,接近人类的自然语
音
,提供更好的用户体验。
VibeVoice
7B
语音
Agent
十篇高质量的
AI
-Agents相关论文,让
AI
教你认识
AI
-Agents
当然也可以加入社群,我会分享PDF以及提示词,让
AI
教你认识什么是
AI
-Agents!
开源模型
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100