首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· AI声音克隆 | 最全最简教程(权威版)
· 好看的图片不知道怎么写提示词?用AI读出来
· 国产视频制作之光-可灵:提示词大全整理
· 高效选择:Ollama与LM Studio深度对比
· 国内厂商语音识别与Whisper评测:现状与概况对比
· ComfyUI安装及生成第一张图
· AI领域的agent是什么意思?
· 几款开源的OCR识别项目,收藏备用
· ChatGLM智谱清言
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
MaskGCT:登上GitHub趋势榜榜首的
TTS
开源大模型
01 前言 近日,香港中文大学(深圳)联手趣丸科技推出了新一代大规模声音克隆
TTS
模型——MaskGCT。
MaskGCT
声音克隆
EverydayWechat:让微信变得更强大,
引
领每日生活新体验
EverydayWechat是一个强大的Python库,旨在为微信用户提供更多便利和功能扩展。它通过与微信接口的交互,实现了一系列功能,包括自动回复、定时发送消息、天气查询、关键词提醒等。通过EverydayWechat,用户可以将微信打造成一个更加智能和个性化的工具。
EverydayWechat
开源
Stability AI开源上新:3D生成
引
入视频扩散模型
将视频扩散模型用于3D生成
引
入潜在视频扩散模型,SV3D的核心目的是利用视频模型的时间一致性来提高3D生成的一致性。
sv3d
建模
ChatGLM
ChatGLM3在线搜索功能升级
在前面的图文当ChatGLM3能用搜索
引
擎
时中,我们让ChatGLM3在搜索
引
擎
上进行的简单的搜索,但是仅仅只能搜索一些简单的内容,比如,时间。
ChatGLM3
搜索
RAG
超越RAG:揭秘IAG框架如何
引
领推理问答系统的创新之路
该框架通过在输入问题后添加一个诱导器来
引
导模型预测答案,从而增强系统的事实准确性。
IAG框架
大语言模型
视频
字节跳动推出MagicVideo-V2:
引
领AI视频生成新时代。
你是否曾想过,仅凭一段文字就能生成一段高清、流畅的视频?现在,这个梦想已经成为现实!字节跳动公司最新推出的MagicVideo-V2,正是一款能够将你的文字描述转化为精美视频的AI视频生成模型。
MagicVideo-V2
视频生成
RAG
一文看懂RAG:大语言模型落地应用的未来
这使得它能够在生成回答时
引
用广泛的信息源。
rag
检索增强
语义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索
0.前言 语义索
引
(可通俗理解为向量索
引
)技术是搜索
引
擎
、推荐系统、广告系统在召回阶段的核心技术之一。
开源模型
语音
字正腔圆,万国同音,coqui-ai
TTS
跨语种语音克隆,钢铁侠讲16国语言
coqui-ai
TTS
实现跨语种、无需训练克隆语音的方法是基于Tacotron模型,该模型使用了一种音素输入表示来鼓励在不同语种之间共享模型容量。
coqui-ai
TTS
语音
RAG
改进召回(Retrieval)和
引
入重排(Reranking)提升RAG架构下的LLM应用效果
为了避免因为大文档chunk化带来的内容分裂,在建库阶段也可做了一定优化,利用summary index对大文档进行索
引
。
大模型
LLM
【一步一步
引
导】从零详细地梳理一个完整的 LLM 训练流程
对于一些多语言模型来讲,要想穷举所有语言中的常用词(穷举不全会造成 OOV), 既费人力又费词表大小,为此,人们
引
入另一种方法:BPE。
大模型
训练
开源
【
TTS
语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
本文目录 5款爆火开源
TTS
语音克隆项目 GPT-SoVITS模型介绍 MaskGCT模型介绍 F5-
TTS
语音模型介绍 FishSpeech1.4
语音克隆
开源模型
清华
震撼科技界:清华大学与智谱AI联手,
引
领中文长文智能写作新纪元!
04 LongWriter模型——
引
领人工智能撰写长文本的新纪元 在人工智能领域,一项突破性的模型——LongWriter,标志着长文本撰写的新篇章。
写作
长文本
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
在当今数字化时代,文本转语音(
TTS
)技术的应用愈发广泛,从智能语音助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的语音合成。
OuteTTS-0.1-350M
音频
开源
3 分钟,把一篇 3000 字长文变成“脱口秀”——开源神器 Twocast 实战指南
输入任意主题/URL/PDF/TXT 复制粘贴就行,不用排版 内置 3 大
TTS
Twocast
开源
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100