首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ChatGLM智谱清言
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· 终极福利:15个中文AI写作提示词帮你覆盖所有主流写作场景!!!
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 第3期 SDXL和SD的10大区别!你知道几个?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· Stable Diffusion 加速/优化/升级 优化出图速度
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
下面进
入
今天的主题~ 需要特别注意:本文只是技术分享,在使用对应模型进行
语
音
合成
时
,需要严格遵照对应项目的要求和法律法规!!
语音克隆
开源模型
大模型
中文版开源Llama 2同
时
有了
语
言、多模态大模型,完全可商用
据项目介绍,Chinese-Llama-2-7b 开源的内容包括完全可商用的中文版 Llama2 模型及中英文 SFT 数据集,输
入
格
式
严格遵循 llama-2-chat 格
式
,兼容适配所有针对原版 llama
开源模型
大模型
百川智能正
式
发布130亿参数通用大
语
言模型百川大模型(Baichuan-13B-Base)
就在刚刚,王小川的开源大模型又有了新动作—— 百川智能,正
式
发布130亿参数通用大
语
言模型(Baichuan-13B-Base)。
大模型
中文
万物皆可接
入
DeepSeek,44家接
入
R1的国产平台超详细大盘点
甚至是否接
入
DeepSeek都能成了股民们,判断是否投资的新方
式
。
deepseek
大模型
Google
AI“同声传译”新进展!Google发布,无监督,
语
音
识别:Translatotron 3!
Translatotron 3结合了三种技术:掩码自编码器、无监督的
嵌
入
映射、和反向翻译,来
实
现这个目标。
Translatotron
语音识别
RAG
LLMOps框架Dify发布Workflow功能,RAG进
入
自由编排
时
代(附产品负责人分享PPT )
通过编排可以将开放域,复杂多步问题,分解为多个子问题分开解决,能用模型用模型,不能用模型的用流程,甚至采用“Human in Loop”的方
式
,将整个工作流程白盒化,把大模型能力限制在封闭的问题内,让大模型更可控
RAG
自由编排
Workflow
GGUF格
式
详解
在大模型领域,GGUF是一个非常常见的词
语
,也是非常常见的大模型预训练结果命名方
式
。
GGUF
大模型
Prompt
结构化Prompt必备基础:5分钟学会Markdown
语
法,
实
现提示词创作自由!
因为他像AI
时
代的编程
语
言一样,可以让提示词的开发象代码一样有规范,不但方便团队的沟通和协作,也方便对于后期的维护升级。
Prompt
提示词
Markdown
微调
大
语
言模型综述<演进,技术路线,区别,微调,
实
践,潜在问题与讨论>
然而激活函数由于在训练和测试
时
使用方
式
完全相同,所以是需要有确定性的输出,不能直接对输
入
x乘随机变量m,这点与Dropout不同(Dropout在测试
时
并不随机置0)。
大模型
教程
AI声
音
克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为
语
音
的技术,通过TTS技术,计算机可以将文字信息转换成人类可听懂的
语
音
输出,
实
现
语
音
合成的功能 目前市场上的AI声
音
我们最多用的还是普通的
声音克隆
教程
ChatGPT
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
接了
语
音
模型模块,可以
实
现丝滑的大模型对话聊天功能。
ai小车
esp32
开源
TypeChat
入
门指南
传统模
式
下,创建自然
语
言模型界面是一项复杂的任务,通常依赖复杂的决策树来确定意图并收集行动所需的输
入
。
TypeChat
「
语
音
识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
那么,这个被誉为“
语
音
识别的未来”的AI工具到底有何过人之处?
Distil-Whisper
语音识别
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端
语
音
交互大模型
例如,在处理
语
音
输
入
时
,模型首先将
语
音
信号转换为离散的符号序列,然后与文本的离散表示进行融合和交互。
Westlake
-
Omni
语音
开源
F5-TTS:上海交大开源超逼真声
音
克隆TTS,告别ElevenLabs,以后就用它了!
实
测真的很牛
不需要复杂的设计如持续
时
间模型、文本编码器和
音
素对齐,能够快速训练并
实
现
实
时
因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
<
...
2
3
4
5
6
7
8
9
10
11
...
>
1
2
4
5
6
7
8
9
100