首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 99%的人都不懂的Stable Diffusion高级功能,Negative Prompt如何正确使用?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· Pytorch安装(保姆级教学 真·满血·GPU版)CUDA更新?torch版本?一文全搞定!
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 造梦师手记:华夏之美,SDXL时代的第一个国风模型和汉服LoRA
· Gpt写小说,常用的中文指令集「实操篇」
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
目前AIgc领域正在持续关注,等到年底的时候做一个最全面的
视
频
和文字讲解,现在还是在等等,目前AI领域热度确实是在持续降温,但是呢,深入了解AI的人都知道,AI的发展不是想人一样需要很长时间的积累,有时候可能就是一个算法的突破
Stable
Diffusion
文生图
controlnet
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人
视
频
生成框架:MuseV MuseV是由腾讯
音
乐娱乐的天琴实验室开源,MuseV专注于生成高质量的虚拟人
视
频
和口型
同
步
,能够制作出具有高度一致性和自然表情的长
视
频
内容
MuseV
视频
数字人
框架
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、录
音
和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声
音
、
视
频
相结合,呈现更具互动性的教育内容
大模型
多模态
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
动态表现力:通过上下文风格化的
音
频
到运动模型(ICS-A2M),MimicTalk能够「捕捉和模仿目标人物的动态说话风格」,使生成的
视
频
更加生动和富有表现力。
MimicTalk
开源模型
教程
用so-vits-svc-4.1进行
音
色转换的极简教程
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
声音
sovits
教程
用so-vits-svc-4.1进行
音
色转换的极简教程!
这里要求切割后的
音
频
长度在5-15秒左右,不能太长或太短。
so-vits-svc
音色转换
教程
RAG
RAG 2.0来了,它能成为生产落地的福
音
吗?
RAG 2.0方法就是克服这样的局部优化办法,通过将预训练、微调和对齐所有组件形成一个统一系统,通过反向传播
同
时优化语言模型和检索器,以最大化系统性能。
RAG
大模型
开源
【语
音
领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
(LID)、语
音
情感识别(SER)和
音
频
事件检测(AED)。
asr
tts
声音
登顶的小熊猫模型出AI产品了!3
步
10秒出一张海报,可免费商用
操作上述简洁
步
骤,你将得到: 平均10秒不到生成一张海报,文字部分几乎无差错,对没有海报制作经验的小白来说非常友好。
图形设计生成器
文生图
「语
音
转换新速度」— 探秘Whisper JAX的70倍速提升
这意味着它能够
同
时处理多个
音
频
片段,大幅缩短了从语
音
到文本的转换时间。
Whisper
语音识别
大模型
苹果一次性开源了8个大模型! 包含模型权重、训练日志和设置,OpenELM全面开源
同
时升级计算机
视
觉工具包 CVNets 为 CoreNet!
OpenELM
大模型
开源
开源免费离线语
音
识别神器whisper如何安装
whisper的日常用途 whisper的核心功能语
音
识别,对于学生党和工作党来说,可以帮助我们更快捷的将会议、讲座、课堂录
音
整理成文字稿;对于影
视
爱好者,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源
wisper
翻译
免费
开源
微软最强全自动数据可
视
化工具!现已开源
8.14,微软开源了之前已经发布的全自动数据可
视
化工具 LIDA。
大模型
大模型
聊天大模型的输出速度应该是多少?单张显卡最多可以支持多少个人
同
时聊天?来自贾扬清最新的讨论~
的博客: https://www.datalearner.com/blog/1051696951947094 适合人类阅读的大模型输出速度 单张显卡可以支撑的
同
时聊天人数
大模型
一文搞懂贝叶斯定理有什么用
在统计学里,长期以来,有
频
率学派和贝叶斯学派两大学派,他们互相鄙
视
对方,就像华山派的气宗与剑宗之争。
贝叶斯定理
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100