首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ChatGPT论文润色进阶指令
· 造梦师手记:足控专属AI大模型,完美的少女
· FaceFusion又更新咯,增强功能再增强!
· Roop升级版FaceFusion换脸AI技术使用以及部署教程
· 数字人直播哪家强?中国数字人平台分析大全
· AI换脸工具:facefusion使用心得
· 性能超出预期!神秘的国产大模型 Kimi 开放 API
· WPS AI
· TrOCR——基于transformer模型的OCR手写文字识别
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
教程
Suno音乐新手指南(手把手完整版教程)
[Rapped Verse] 说唱的诗歌 [Powerpop Chorus] 动力流行合唱 元标签的基本用法和进阶技巧 一首完整的歌曲通常都
包
括以下模块中的一些或者全部
suno
歌曲
教程
【AI代理】扣子,开始探索多代理模式
代理模式不仅可以拓展大模型的功能(比如给大模型加上网页搜索,加入知识库等),还可以规避大模型的弱点(比如需求是一段代码,但是大模型回复的内容不单单
包
含代码,还有一些解释语句)。
多代理模式
大模型
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
包
含两个核心模型:SenseVoice 负责语音识别和音频处理,CosyVoice 负责语音生成和控制。
asr
tts
声音
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
该模型在
包
含10万小时多语言数据的Emilia数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语种生成能力,同时保持了较强的稳定性。
MaskGCT
声音克隆
语音
6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
要么掏钱
包
,要么忍受各种奇葩限制。
MeloTTS
语音工具
AI Comic Factory:AI(连环)漫画生成器
首先,该项目是开源的,但需要多个组件来运行,
包
括前端、后端、LLM(大型语言模型)、SDXL等。
生成式AI
Prompt
一种通用的 Prompt 框架 - CRISPE
它
包
括设计提示,引导模型生成特定的语调、风格或内容类型。
Prompt
提示词工程
语音
关于AI声音生成的一切(语音+音乐+嘴型)
其实声音生成也有很多革命性的工具,例如高质量的声音识别、文字转成人声、人声克隆、音乐生成,已经能组成完整工作流了,其中一些工具甚至已经打
包
好了,只要下载解压就能用!
声音
腾讯
深度体验3天后,我把腾讯这款copilot锁进了程序坞
1个搜索框、4个按钮,
包
圆AI搜索、AI笔记、AI写作、文生图、AI收藏夹……这样的AI产品总算来了。
copilot
ima
知识库
不出所料,字节个把月就整出了自己的manus,不用积分,无需会员,快来体验coze空间吧
manus的8个评价 同时在群里跟小伙伴说,字节阿里一两个月大概会推出类似的产品 今天果然不出所料,字节的coze空间他来了 同时阿里的心流https://iflow.cn/也来了
包
括智谱清言的沉思也在四月初发布了
manus
阿里
Microsoft
来自Microsoft Build 2023:大语言模型是如何被训练出来的
本场汇报共40多分钟,
包
含2个方面,一个是如何训练出GPT这样的大语言模型,里面
包
含了大语言模型的训练过程以及相关的技术,虽然是一种high-level的讲解,但是对于理解ChatGPT的训练十分有用。
大模型
Agent
深度好文,Agent盛行前传
agent本身是决策主体,除此之外甚至
包
括传感器和执行器都算在环境(environment)里。
Agent
大模型
ChatGLM
玩一玩ChatGLM3,1660s即可流畅运行!
我会提供一键运行
包
,下载解压运行即可使用。
大模型
ChatGLM
打造音乐传奇:Suno推出音乐生成模型Suno V3,让每个人都能成为作曲家
**副歌(Chorus)**:歌曲中的重复部分,通常
包
含主要的钩子(hook)和主题信息。
suno
歌曲
音乐
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
该框架
包
括用于常见工作流程的插件,例如语音活动检测和语音转文本。
voice
agent
开源
音视频
<
...
5
6
7
8
9
10
11
12
13
14
...
>
1
2
4
5
6
7
8
9
100