首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
构建开源
多
模态RAG系统
在这个新的冒险中,我们将深入研究使用开源大型
语
言
多
模态(LLMM)构建
检
索
增强型生成(RAG)系统的过程。
RAG
大模型
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有
多
“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、
语
音
转文字
提示词
prompt
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置
语
速、添加停顿词、口头
语
、笑声!!
对话式 TTS: ChatTTS针对对话式任务进行了优化,实现了自然流畅的
语
音
合成,同时支持
多
说话人。
chattts
tts
文生语音
大模型
大模型再发展5年,搜
索
引擎还在么?
可以想象一个极端情况,就是全网50%的内容都和一个人工智能生成的内容发生链接,那按照搜
索
的机制,无疑的这是应该被排到前面的,而则可能是不对的,它不一定质量很好,而只可能是被用其它模型生成内容用的
多
。
大模型
Sora
OpenAI视频模型Sora的推理生成成本
多
高?
(Video Encoder/Decoder 的计算量相比 DiT 可以忽略不计) Sora 的模型
多
大呢?
Sora
推理
算力
开源
QAnything:网易有道最新开源的“本地化部署知识库”AI问答系统
·跨
语
言问答支持,可以在中英文问答之间自由切换,不受文档
语
言的限制。
网易
RAG
知识库
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
工具
TTS,一个奇妙的AI工具
简介 TTS是一个将文本变换成
语
音
的AI工具。
TTS
文本转语音
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
作为实验室任务参与者的LLM 人工智能心理学家们正在深入探
索
LLM的心理学特质,他们的研究揭示了LLM与人类认知机制在
多
大程度上存在差异和相似性。
大语音模型
ChatGLM
chatglm3基础模型
多
轮对话微调
user、assistant、换行等特殊token SFT的方式 假设SFT的数据为 Q1,A1,Q2,A2,Q3,A3 SFT的过程只会计算 A1,A2,A3 的loss,且一次推理会同时计算
多
轮对话的
ChatGLM
微调
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
通过约70万小时的
多
语
种数据训练,实现了接近人类水平的
语
音
合成效果,目前已更新到1.4版本。
Fish
Speech
本地搭建
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI
语
音
...
涵盖了 AI 绘画、AI 视频、AI
音
乐、AI 数字人等各个领域 今天给大家推荐一款AI神器,匹诺曹Pinokio!
AI绘画
AI视频
AI音乐
数字人
数字人之声
音
克隆:无样本,1分钟样本完美克隆声
音
,开源
最近在搞克隆人,发现一个很好的声
音
克隆项目,测试了一下,效果真不错,可以直接用,也可以微调后使用,好了废话不
多
说,直接上干活,哈哈~~ &ensp
数字人
声音克隆
GPT-SoVITS
开源
【TTS
语
音
克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
开源:F5-TTS的代码和
检
查点被开源,以促进社区发展。
语音克隆
开源模型
被高估的Pika,被低估的
多
模态AI
在行业主
语
为“落地”的当下,
多
模态 AI 正走向场景化、实用化、商业化。
大模型
多模态
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100