首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 实测:本地跑llama3:70B需要什么配置
· 数字人:从科幻走向现实的技术革命
· Suno音乐新手指南(手把手完整版教程)
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· AI换脸工具:facefusion使用心得
· 火山写作
· AI高手都在用的10个提示词prompt网站,建议收藏!
· 2024!深入了解 大语言模型(LLM)微调方法(总结)
· 20个ChatGPT超实用的提示词(Prompt)
· Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
视频魔法
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
诸公可知目前最牛逼的TTS免费开源项目是哪一个?没错,是Bert-vits2,没有之一。它是在本来已经极其强大的Vits项目中融入了Bert大模型,基本上解决了VITS的语气韵律问题,在效果非常出色的情况下训练的成本开销普通人也完全可以接受。
Bert-vits
语音
2023-12-08
2023-12-08
数字人
揭秘数字人困境:代理商亏钱、直播屡被封、刘润也不用了
“不要工资、无需五险一金、永不离职,只要7999,数字人员工带回家。” “24小时无限度加班,一次购买终身使用。” “看到这一排机器了吗?都是给你赚钱的金矿。” 如果盘点2023年最赚钱的项目,数字人必然榜上有名。这个最早在刘润2022年度演讲中被大众熟知的项目,本质上是企业的saas部署——技术门槛低;用户获得感高——输入信息后即可拥有了可视的“人”;盈利空间可观——直播带货、短视频,人能干的活它似乎都可以,落地场景丰富。
数字人
2023-12-07
2023-12-07
视频
用AI做郭德纲说英文相声的爆款视频(详细教程)
郭德纲用英文说相声的短视频火爆全网,单条视频点赞破9.7万,转发量更是高达11.8万,AI的内容形式层出不穷,不断地出爆款,其实这个两周前有出过教程--用这个AI,把视频翻译成30+种语言,丝滑程度,随时能把生意做到全世界!
视频
翻译
语言
2023-12-07
2023-12-07
开源
人脸识别的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸识别算法和工具。它支持多种编程语言,包括Python、C++、Java等。
人脸识别
开源项目
2023-12-07
2023-12-07
视频
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
使用 Wunjo AI 解锁神经网络无与伦比的功能。无论您是钻研语音合成、制作 Deepfake 动画、通过文本提示绘制稳定扩散视频还是视频制作,Wunjo AI 都能满足您的需求。
AI语音克隆
实时语音识别
2023-12-06
2023-12-06
语音
国内厂商语音识别与Whisper评测:现状与概况对比
随着人工智能技术的飞速发展,语音识别已经成为了现代社会中一个重要的研究领域。语音识别技术不仅可以应用于智能助手、语音控制、自动化客服等领域,还有望为残障人士提供更便捷的沟通工具。国内的科技企业在语音识别领域也在不断迭代和创新,其中不乏一些具有竞争力的语音识别技术,如讯飞、百度、阿里巴巴等,这些厂商的技术在一定程度上已经接近或达到了国际领先水平。同时,Whisper(飞思卡尔语音识别技术)作为一项国际上也备受关注的语音识别技术,在语音识别领域也有着广泛的应用。Whisper技术在噪声环境下依然能够准确识别并理解语音指令,因此在汽车、智能家居等领域有着广 ...
语音识别
Faster-Whisper
2023-12-04
2023-12-04
在 WebUI 中使用 AnimateDiff 的一些问题和技巧
这两天晚上没事的时候就会尝试下AnimateDiff,发现这真的让视频生成上了一个大台阶,估计是到了AI视频爆发的前夜了。其实这两天也在轮流学习使用WebUI和ComfyUI,发现同等帧率设置下ComfyUI的生成速度要快很多而且占用资源少一些,但是不知道是不是心理原因总感觉ComfyUI的清晰度不如WebUI,所以相对来说WebUI玩的更多一些(其实主要还是因为简单,ComfyUI研究一晚上只造出了基础的生成和放大流程o(╥﹏╥)o),下面还是分享一些在使用WebUI方面的遇到的问题或小技巧
AnimateDiff
SD
2023-12-04
2023-12-04
语音
语音识别的未来已来:深入了解faster-whisper的突破性进展
faster-whisper是基于OpenAI的Whisper模型的高效实现,它利用CTranslate2,一个专为Transformer模型设计的快速推理引擎。这种实现不仅提高了语音识别的速度,还优化了内存使用效率。faster-whisper的核心优势在于其能够在保持原有模型准确度的同时,大幅提升处理速度,这使得它在处理大规模语音数据时更加高效。
语音识别
Faster-Whisper
2023-11-29
2023-11-29
视频
Stability AI推出视频生成模型Stable Video Diffusion
Stability AI近日推出了名为Stable Video Diffusion的视频生成模型,该模型基于该公司现有的Stable Diffusion文本转图像模型,能够通过对现有图像进行动画化生成视频。与其他AI公司不同,Stable Video Diffusion在开源领域提供了少数几个视频生成模型之一。
Video
视频创作
SD
2023-11-22
2023-11-22
Roop参数说明,ROOP->StyleGAN演示!
Roop参数说明,ROOP->StyleGAN演示!
视频
StyleGAN
2023-11-20
2023-11-20
开源
开源本地化部署的「妙鸭相机」,真的要革了「海马体」们的命了?|手把手教你搭建「妙鸭相机」
【新智元导读】EasyPhoto作为妙鸭相机平替,有着不输妙鸭相机的生成质量,还有更好的定制化空间和本地部署的优势。
训练
2023-11-15
2023-11-15
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。作者提供了几种优化方式,包括批处理、半精度处理以及BetterTransformer,以提高转录速度。最终,作者以实际测试数据展示了不同优化方式的速度对比。同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。
音频
Whisper
2023-11-14
2023-11-14
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程图
音视频
Flow
Matching
2023-11-13
2023-11-13
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短视频火爆全网,同类型的AI短视频层出不穷,更有好莱坞明星说中文的短视频,不断地出爆款,那么现在我们就开始学习如何制作一个同类型的AI短视频吧!
数字人
音视频
2023-11-03
2023-11-03
Stable Diffusion
Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法
今天给大伙分享一下目前来看比较稳定的文本生视频的插件 AnimateDiff。之前虽然小视频生成比较火,不过出的视频都不太稳定,目前来看 AnimateDiff 是相对比较稳定的,而且能同时支持和其他插件一起使用。
动画
animate
sd
2023-10-20
2023-10-20
<
1
2
3
4
5
6
7
>
1
2
4
5
6
7
8
9
100