首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 第3期 SDXL和SD的10大区别!你知道几个?
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 让 AI 更懂你的 Prompt 提示词宝藏网站-FlowGPT
· 高效选择:Ollama与LM Studio深度对比
· 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· stable diffusion最全18种controlnet模型,详细教程讲解。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
国内首个!最火的MoE大模型APP来了,免费下载,人人可玩
而且还会
分
析面相?
MoE大模型
APPa
大模型
宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
使用 agent 自主检索技术,实现适
配
核电系统的高效智能 2.
宁德核电
大模型
PPT又又有新突破了!智谱AI代码流造PPT
智能体工作流:从需求到成片的“大脑” 自动规划逻辑链 markdown 输入:“生成Z世代消费趋势报告” 它会自动拆
分
「现象→数据→
PPT
制作
AI
Github
我去,找到一个Github上非常优秀的AI项目,可控制鼠标、键盘,模拟人类操作,太丝滑,收藏~~~
Office、图像/视频编辑工具) 多模态输入:以截图为输入,支持键盘鼠标操作输出 自主能力:内置“认知反思+技能更新”模块,能不断自我优化 模块化设计:兼顾高可控性和扩展性,轻松适
配
新环境
AI
Agent
开源项目
教程
用so-vits-svc-4.1进行音色转换的极简教程
如果是歌声的话,还需要使用特别软件进行人声
分
离,将伴奏声和人物干声
分
离,然后再对干声训练得到ta的声音模型。
声音
sovits
OpenAI
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
它能够帮助开发者
分
担繁重的工作,并构建高质量的 AI 应用。
RAG
检索
向量库
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知识库
总的来说,看起来效果还不错,下面跟着树先生一起来试试水~ 本文我将
分
3 步带着大家一起实操一遍,并与之前 ChatGLM-6B 进行对比。
知识库
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
7.2k License: Apache-2.0 ESPnet 是一个端到端的语音处理工具包,涵盖了端到端语音识别、文本转语音、语音翻译、语音增强、说话人
分
离等功能
AudioCraft
音频
大模型
大模型:泛化即智能,压缩即一切!
Ilya Sutskever 提出可以通过学习数据中的数学结构,即通过
分
布匹
配
来实现这一目标。
泛化
大模型
换脸
FaceSwapLab,截止2023年8月最好用的一键换脸工具
基于该插件,在AI绘画的时候,可以很好的实现用一张人脸照片一键换脸,不过这个工具的缺点是部
分
照片不太像,需要生成较多的照片,才能找到比较合适的。
一键换脸
提示词
你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
项目管理与协作:当用户需要 AI 帮助管理项目、
分
配
任务或协调团队合作时,BROKE 框架可以提供明确的背景、角色和目标,确保项目的成功执行
大模型
提示词
大模型
比GPT-4快18倍,世界最快大模型Groq登场!每秒500 token破纪录,自研LPU是英伟达GPU 10倍
实际上,搜索占据了超过四
分
之三的处理时间,而非内容的生成!
Groq
大模型
Fooocus更新了2.3
在高级设置里调试工具下面多了几个选项,比较常用的就是设置是否随机通
配
符。
fooocus
文生图
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
高性能:与 Whisper-small(已开源) 和 Whisper-large 相比,SenseVoice-Small 的性能
分
别快 5 倍和 15 倍以上。
asr
tts
声音
阿里
体验完阿里的EMO模型,我emo了
00:12 四、全民唱演体验 全民舞王利用的是一种口唇同步的技术,这是一种让画面人物的口型与所
配
的语音或文字信息精确匹
配
的技术
EMO
文生图
<
...
34
35
36
37
38
39
40
41
42
43
...
>
1
2
4
5
6
7
8
9
100