首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· PPT又又有新突破了!智谱AI代码流造PPT
· Suno音乐新手指南(手把手完整版教程)
· ComfyUI安装及生成第一张图
· 会“追问”的Agent,大模型知识库另类实践
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 聊聊我对AI Agents技术的一些看法
· Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
· 【工具书】文生图Midjourney最全prompt提示词分类对照表
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
“实时”语音翻译!AI语音具有“情绪”!最强
开
源
AI大模型来了
如果你有这样的困扰,那么你一定会对meta的
开
源
AI模型seamless-communication感兴趣。
大模型
开源模型
语音
大模型
最强
开
源
大模型Llama 3,在扎克伯格设想中其实是这样的
4、Llama 3模型之所以能够成为目前最强大的
开
源
大模型,主要是因为这四大关键要素:模型架构、预训练
数
据
、扩大预训练规模、指令微调。
Llama
3
大语言模型
工具
46.6k星星!最强
开
源
AI集合系统,一键部署全网AI工具都能直接用,UI简直是视觉盛宴!
LobeChat的
开
源
,把AI功能集合到一起,真的太爽了。
AI开源
集合
视频
GPT-4o实时语音方案提供商Livekit
开
源
voice agent:轻松处理音视频流
轻松访问 LiveKit WebRTC 会话并处理或生成音频、视频和
数
据
流。
voice
agent
开源
音视频
阿里
开
源
版妙鸭相机来了,无限出个人写真图(阿里达摩院出品)
FaceChain的模型由ModelScope
开
源
模型社区提供支持。
妙鸭相机
大模型
最佳
开
源
文生图大模型可图:安装与批量出图的完整教程
经过
数
十亿个文本图像对的训练,Kolors 在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面比
开
源
和专有模型表现出显著优势。
可图
kolors
FaceFusion参
数
详解
(2.2)杂项参
数
(2.2.1)Skip Download ⚠️天朝网络必须得
开
(除非你的网络自动下载模型没问题)。
FaceFusion
文生图
视频
爆火「视频版ControlNet」
开
源
了!靠提示词精准换画风,全华人团队出品
目前,团队已将这一方法在GitHub上
开
源
。
ControlNet
截至2023年5月份业界支持中文大语言模型
开
源
总结及商用协议分析
目前,Flan-T5
开
源
了很多个模型,最大的一个参
数
110亿。
大模型
Agent
只需四步就能构建自己的Agent!达摩院新
开
源
框架小白也能用
开
发者们可以参考上述教程很容易搭建属于自己的智能体,ModelScope-Agent 依托魔搭社区,未来会适配更多新增的
开
源
大模型,推出更多应用。
大模型
clone-voice:一键克隆声音,
开
源
AI技术让声音创作更便捷、更个性化
一、什么是clone-voice clone-voice是一款免费
开
源
的声音克隆工具,它凭借先进的人工智能技术,能够分析和模拟人类声音的特征,从而实现高质量的声音克隆.
clone-voice
声音克隆
Roop参
数
说明,ROOP->StyleGAN演示!
下面就挨个来介绍一下ROOP的参
数
。
视频
StyleGAN
SadTalker
数
字人常见问题3
SadTalker
数
字人制作工具,用自带的图片音频可以生成,而用自己的图片、音频生成视频就不行。
SadTalke
StableDiffusion
StableDiffusion常用基础参
数
说明
图像总
数
是这个值乘以批次
数
。
文生图
F5-TTS:上海交大
开
源
超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
音频克隆的
开
源
项目很多,但是每次项目里要用的时候,总还是惦记着11labs的api。
F5-TTS
音频克隆
<
...
11
12
13
14
15
16
17
18
19
20
...
>
1
2
4
5
6
7
8
9
100