首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
微调
NEFTune:在Embedding中加
入
噪⾳提⾼指令微调效果!
NEFTune: Noisy Embeddings Improve Instruction Finetuning中,研究⼈员尝试了⼀种不同且更简单的⽅法:在训练过程中向
嵌
入
向量添加均匀随机噪声
NEFTune
大语言模型
数字人
AI虚拟主播数字人技术
实
现Wav2Lip
本文主要
实
现图片说话(如下图的蒙娜丽莎)、视频融合
语
音
(这里的核心都是人物口型与
音
频中的
语
音
唇形同步)。
数字人
视频
大模型
深
入
探秘:百川7B大模型的训练代码解析,揭秘巨无霸
语
言模型背后的奥秘
(二、软件和部署) 本期开始,为大家讲下这些大模型是怎么训练生成的 首先,为了确保本系列的讲解流畅,我将直接深
入
讲解大型
语
言模型的代码。
大模型
开源
6个最佳开源TTS引擎
TTS引擎用于
实
现文本到
语
音
的转换。
TTS引擎
开源模型
开源
17K star!30秒偷走你的声
音
,开源声
音
克隆工具
然后,它可以生成听起来自然的
语
音
,以多种
语
言模仿该
语
音
,同
时
为用户提供对情感、口
音
、节奏和
语
调等参数的精细控制。
OpenVoice
声音克隆
开源
StableDiffusion
AI绘画由
入
门到精通:StableDiffusion精讲课程
以下为本站SD画图软件生成图片赏析: StableDiffusion文生图软件的核心优势在于其能够利用深度学习技术,通过自然
语
言的描述生成高质量的图像。
SD
视频课程
AI绘画
Agent
Coze多智能体(Multi-Agents)模
式
体验!
以一个具体的
实
例作为起点,我计划创建一个“虚拟互联网软件公司”,为开源项目的快速开发提供全面的服务支持。
Coze
多智能体
ChatGPT
实
战:如何用AI Agent
实
现ChatGPT流程化写作,产能翻倍
ChatGPT 虽然是个相当厉害的 AI 聊天机器人,能回答你各
式
各样的问题,并根据你的需求生成内容,但它其
实
更像一个等待指令的工具,而非一个能自主思考的助手。
Agent
写作
ChatGPT
Prompt全攻略(一):ChatGPT
时
代,什么是Prompt?
随着GPT-3等预训练
语
言模型的进步,ChatGPT这类交互
式
人工智能chatbot应运而生。
prompt
大模型
深
入
解析 Mistral AI 的 Mixtral 8x7B 开源MoE大模型
尽管配备了八个专家,在
实
际运算
时
每个Token仅需两个专家参与。
开源模型
Mixtral
8x7B
开源
SD3 正
式
开源 Sora同源架构
2月16日伴随着OpenAI世界大模型Sora的发布,stability_ai也发布了其最新的模型Stablediffusion3,如果说一个是
音
视频方向
SD3
绘画
工具
FFmpeg之父新作——
音
频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI
语
音
编解码器类似,使用深度学习网络进行压缩,TSAC这里引
入
Transformer结构来提升性能。
TSAC
音频工具
Prompt
Prompt及AI提问
实
践
· 模型本身的
实
现方
式
。
Prompt
大模型
提问
开源
clone-voice:一键克隆声
音
,开源AI技术让声
音
创作更便捷、更个性化
Mel-spectrogram是一种能够有效捕捉
音
频信号频谱特征的工具,它将
音
频信号转换为一种更适合机器学习模型处理的图像形
式
,成为许多
语
音
合成模型的标准输
入
形
式
,有助于模型更好地理解和学习声
音
的特征。
clone-voice
声音克隆
心理
万字长文,大
语
言模型如何宣告心理学的死亡?
行为主义的幽灵 延续人类心理学的研究方法 心理学家在谈论一个人的人格或者一个人的心理
时
,其
实
是在深
入
了解他的思维模
式
、情感反应和行为方
式
。
大语音模型
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100