首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 几款开源的OCR识别项目,收藏备用
· 无需翻墙,可合法使用的8款国内AI大模型产品
· stable diffusion如何确保每张图的面部一致?
· PPT又又有新突破了!智谱AI代码流造PPT
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 从思维链(CoT),到思维树(ToT),再到思维图(GoT):用LLMs解决复杂问题!
· 胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
· AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
今天,介绍一个开源创新的虚拟人视频生成框架:MuseV MuseV是由腾讯音乐娱乐的天琴实验室开源,MuseV专注于生成高质
量
的虚拟人视频和口型同步,能够制作出具有高度一致性和自然表情的长视频内容
MuseV
视频
数字人
框架
AI落地里那些假的机会
(和上面的例子不同,这个是使用价值自身就有
问
题) 这类产品的奇妙之处在于:假设技术成熟度够,那这种大品类会变成巨头激烈竞争的市场;如果技术不成熟,那就还是传统品类。
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
Transformer(DiT)的应用: F5-TTS利用了Diffusion Transformer,这是一种结合了扩散模型的Transformer结构,专门用于处理生成任务中的对齐和数据生成
问
题
F5-TTS
音频克隆
Stable Diffusion
耗时80小时!超详细的胎教级Stable Diffusion使用教程,看这一篇就够!
Diffusion(简称“SD”) 在正式安装之前希望大家先一起查看一下自己的电脑配置, 需要注意的是以下两点: 01.电脑系统是Win10或者Win11 为了避免一些奇怪的兼容性
问
题
文生图
AGI
通往AGI之路,提示词入门
在这里,我举一个简单的例子,现在我想知道天空为什么是蓝色的,应该怎么去向大模型提
问
呢。
AGI
提示词
AI出题,做不完,根本做不完
就是让大模型扮演一个角色,定义好这个角色的能力,然后给它提出一些相关的
问
题,让它按照某种格式输出。
大模型
提示词
试题
Sora
解读OpenAI Sora文生视频技术原理
输入潜变
量
被分解成几个patch并由几个DiT块处理。
sora
ComfyUI
ComfyUI-DDetailer脸部修复
只要你乐意,可以串联七个八个,脸和手一起修都没
问
题。
ComfyUI
脸部修复
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
Translatotron 3解决了什么
问
题?
Translatotron
语音识别
如何使用 Megatron-LM 训练语言模型
为了构建索引,首先根据训练参数计算每个 epoch 的数
量
,并创建一个排序,然后对数据进行 shuffle 操作。
开源模型
视频
图文生成短视频的方法
AI工具推荐:国内类ChatGPT平台 1、百度 —— 文心一言 2、阿里 —— 通义千
问
3、科大讯飞——星火认知大模型 4、360 —— 360智脑 具体的可以看这篇文章 《1&
视频
ChatGPT
写作
AI写作不如意?万字长文深度剖析背后原因
锯齿边界 在《导航锯齿形技术前沿:AI对知识工作者生产力和质
量
影响的实地实验证据》一文中,Dell’Acqua等人描述了波士顿咨询集团的顾
问
如何在工作中使用像GPT-4这样的AI工具。
AI写作
大模型
中文通用大模型最全汇总
ChatGLM: 地址:https://github.com/THUDM/ChatGLM-6B 简介:中文领域效果最好的开源底座模型之一,针对中文
问
答和对话进行了优化
大模型
开源模型
ComfyUI
解放AI生产力——为什么要使用ComfyUI
这样的生产方式面临两个
问
题: 1.有些东西你很难用文字表达清楚,比如坐着,脚放在前面。
文生图
Stable Diffusion
Stable Diffusion由入门到精通
当然你肯定会
问
哪里粘贴?
prompt
文生图
<
...
58
59
60
61
62
63
64
65
66
67
...
>
1
2
4
5
6
7
8
9
100