首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 从专业ASR到统一音频LLM:七大顶尖模型的深度对比分析
· ComfyUI官方使用手册【官网直译+关键补充】
· ComfyUI 基础教程(一)环境部署和插件安装
· TrOCR——基于transformer模型的OCR手写文字识别
· 请以“续航”为题目,写一篇议论文
· 深度解读|做出海必看的一份产品报告
· ComfyUI环境方面开窍了,成功跑通animatediff
· Stable Diffusion | 常见问题清点汇总
· SD插件|EasyPhoto|妙鸭相机平替|美颜算法
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
教程
Suno音乐新手指南(手把手完整版教程)
Prologue of Thought [intrumental intro] [Verse 1] In the dawn of the digital age, a
whisper
suno
歌曲
教程
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
2.2.3 音频-语言分支 音频语言分支通过结合来自
Whisper
-large-v3模型的音频编码器和新引入的音频 Projector ,扩展了一个在视觉和视频数据上预训练的LLM。
Baichuan-Omni
多模态大模型
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
例如,AudioGPT可以利用FastSpeech、GenerSpeech、
Whisper
等模型来实现文本转语音、风格转移和语音识别等任务。
大模型
<
1
2
3
>
1
2
4
5
6
7
8
9
100