首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· GPU 性能(数据表)快速参考
· MCI-GRU:在真实金融交易中验证有效的股票价格预测模型
· AI+大模型在金融行业的应用场景
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 国内法律类大模型介绍
· Stable Diffusion|提示词高阶用法(二)双人同图
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 大模型量化:什么是模型量化,如何进行模型量化
· 深度对比丨探索LLM(大模型)部署服务的七大框架差异
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频制作
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
这次AI要革翻译的命了么?!(先别急着骂,我们先看看产品) 你是否遇到过这样的情况: 你想和一个说不同语言的人交流,但是你不会他的语言! 你想把一段语音转成文字,或者把一段文字转成语音,但是你不知道怎么操作! 你想把一种语言的语音或文字直接转换成另一种语言的语音或文字,但是你需要用多个工具,而且效果不理想! 如果你有这样的困扰,那么你一定会对meta的开源AI模型seamless-communication感兴趣。
大模型
开源
语音
2024-03-19
2024-03-19
教程
用so-vits-svc-4.1进行音色转换的极简教程
这篇文章介绍了使用so-vits-svc项目进行声音转换的过程,包括歌声和普通讲话的转换。文章强调了声音转换需要采集和处理语音干声,以及训练声音主模型的重要性。文章还提供了详细的步骤和工具推荐,如使用Slicer-gui进行人声分离,租用服务器实例进行模型训练,以及使用webui页面或脚本命令进行模型推理。最后,文章提供了训练模型和推理的示例命令。
声音
sovits
2024-03-13
2024-03-13
剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
剪映应用推出了一项名为“AI克隆音色”的创新功能,这一功能允许用户在短短5秒内捕捉并复制特定的声音样本。通过先进的人工智能技术,剪映能够分析并学习目标声音的特征,然后生成与原声音极为相似的复制品。这一功能的上线,不仅为用户提供了前所未有的创作自由度,也为声音设计和个性化服务开辟了新的可能性。
剪映
声音克隆
2024-03-06
2024-03-06
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
论文由微软研究团队撰写,这篇论文深入探讨了Sora的发展背景、核心技术、新兴应用场景、现有的局限性以及未来的发展机会,基于公开资料和团队自行进行的逆向工程分析。文中详尽且逻辑清晰,建议细读全文以获得深入了解。
sora
论文
2024-03-01
2024-03-01
Sora
Sora懂不懂物理世界?
我们真实的视频是会体现 真实世界的物理规律,以航行为例这意味着 AI 需要考虑到重力、浮力、碰撞以及船体结构在动态环境中的行为。那么问题来了,Sora到底懂不懂物理世界呢?
文生视频
视频生成
sora
2024-02-22
2024-02-22
ComfyUI
免费的文本生成视频解决方案:AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI
AnimateDiff 是一个基于 Stable Diffusion 模型的文本生成视频插件,它通过控制模块影响图像生成过程,使得生成的图像序列具有与训练视频剪辑相似的特征。这个插件的核心功能是通过大量短视频剪辑的训练,优化图像之间的过渡,确保视频帧的流畅性,从而生成高质量的短视频。
视频生成
文生视频
2024-02-22
2024-02-22
大模型
视频大模型训练相关词条解释
Sora是OpenAI公司发布的一款AI视频生成模型。它不仅能够根据文字指令创造出既逼真又充满想象力的场景,而且能生成长达1分钟的超长视频,不管是一镜到底还是分镜头切换模式,都能够保持角色及背景神一般的一致性和稳定性。那么视频大模型的训练都有哪些技术点呢?今天给大家带来视频模型训练相关的词条解释,而且是小学生也能看懂的哦
视频生成
sora
词条
2024-02-21
2024-02-21
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
阅读本文你将完全理清什么是Sora、它能干什么、它为啥牛、它的原理以及将带来什么影响,而且文末还有干货附送哦。
视频生成
sora
2024-02-18
2024-02-18
Sora
解读OpenAI Sora文生视频技术原理
OpenAI Sora文生视频(图像看作单帧视频)一放出就炸翻整个AI 圈,也是ChatGPT掀起GenAI热潮时隔一年后,OpenAI再次史诗级的更新。OpenAI 随后公布的技术综述[文献1],难掩其勃勃雄心:视频生成模型作为世界模拟器。
sora
2024-02-18
2024-02-18
Sora
中学生也能看懂的Sora视频生成原理解读
首先,Sora通过一个叫做“视频压缩网络”的技术,将输入的图片或视频压缩成一个更低维度的表示形式,接下来,Sora将这些压缩后的数据进一步分解为所谓的“空间时间补丁”(Spacetime Patches),然后通过“文本条件化的Diffusion模型”Sora不仅能生成具有高度创造性的视频和图片,还能确保生成内容与用户的文本提示保持高度一致。
视频生成
sora
2024-02-18
2024-02-18
Sora
一文带你看懂OpenAI-Sora生成视频的原理
OpenAI非常突然地发布了其首款AI视频生成模型——“Video generation models as world simulators”(作为世界模拟器的视频生成模型),名字叫做Sora,可以创建长达 60 秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及充满活力的情感的多个角色。这标志着我们如何理解和创造虚拟世界的方式即将迎来根本性的变革。本文将带你看懂Sora生成视频的原理
视频生成
sora
2024-02-18
2024-02-18
Sora
通俗易懂地解释OpenAI Sora视频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
为什么Sora可以引起如此大的关注?Sora生成的视频与此前其它平台生成的视频到底有哪些区别?有很多童鞋似乎对这些问题依然有疑问,本文将以通俗的语言解释Sora的独特之处。
sora
视频生成
2024-02-18
2024-02-18
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
就说Sora有多火吧。生成的视频上线一个、疯传一个。英伟达高级研究科学家Jim Fan高呼,这就是视频生成的GPT-3时刻啊!尤其在技术报告发布后,讨论变得更加有趣。因为其中诸多细节不是十分明确,所以大佬们也只能猜测。包括“Sora是一个数据驱动的物理引擎”、“Sora建立在DiT模型之上、参数可能仅30亿”等等。所以,Sora为啥能如此惊艳?它对视频生成领域的意义是?这不,很快就有了一些可能的答案。
sora
openai
视频生成
2024-02-17
2024-02-17
工具
TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
在GPT技术不断爆火的背景下,人工智能技术也在不断的发展和演化。各种AI工具也层出不穷,其中 语音克隆技术 也是尤为引人瞩目的产品之一。而 OpenVoice 作为一款强大的多语言即时语音克隆AI工具,可以为用户提供高效、个性化的语音克隆服务,是一款值得推荐的项目。
tts
文本转语音
2024-02-15
2024-02-15
换脸
全新换脸工具ReActor,比roop更强!
之前介绍过 SD 的换脸插件 roop,今天我们介绍一个比 roop 更强的换脸插件 ReActor,嗯,它们其实是一个作者,ReActor 是在 roop 的基础上更新换代的,roop 后续作者应该不维护了,所以小伙伴们可以直接使用 ReActor。 之前 roop 介绍的比较简单,我们今天来详细介绍一下 ReActor。 话不多说,我们直接开整。
ReActor
roop
换脸
2024-02-01
2024-02-01
<
1
2
3
4
>
1
2
4
5
6
7
8
9
100