首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· stable diffusion 远端跑图—— Api基础知识掌握
· ComfyUI-基础图生图&基础图片缩放
· 20个常见AI绘画工具大汇总(含免费版哦~)
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· ChatGLM智谱清言
· Stable Diffusion|背景替换只需要两分钟!
· 深度洞察:人工智能体(AI Agent)2024年重要发展趋势指南
· AI助力Logo设计!5类关键词帮你快速获取高质量灵感
· 字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
· SD入门教程二:文生图基础用法(提示词)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
2023年人工智能行业总结(精简版)
首先,语言
模
型
线取得了显著突破。
人工智能
行业总结
工具
TTS,一个奇妙的AI工具
网络上有很
多
文字转语音网站都采用了这个TTS开源工具。
TTS
文本转语音
Python
这可能是史上最全的 Python 算法集(附论文及python源码链接)
基于网格的搜索 迪杰斯特拉算法 A*算法 势场算法
模
型
预测路径生成 路径优化示例 查找表生成示例 状
态
晶格规划 均匀极性采样(Uniform polar
算法
python
Stable Diffusion
小白设计师福音:Stable Diffusion 16款插件测评,好用不?推荐吗?
其中包含,清空正向提示词”和“清空负向提示词、提示词起手式包含人物、服饰、人物发
型
等各个维度的提示词、一键清除正面提示词与负面提示词、随机灵感关键词、提示词分类组合随机、动
态
随机语法等。
SD
插件
文生图
Prompt
10大高效的Super Prompts,让GPT拥有超能力!
忘掉以往的AI应用
模
式,今天要向你展示的是ChatGPT的超能力。
Prompt
GPT
提示词
数字人
AI数字人:重构人货场的新力量
随着人工智能技术的飞速发展,生成式AI正在深刻改变着电商行业的运作
模
式。
数字人
AI
商业
Stable Diffusion
读取大脑重建高清视频,Stable Diffusion还能这么用
之所以会如此,是因为与重建一张静
态
图片不同,我们视觉所看到的的场景、动作和物体的变化是连续、
多
样化的。
stablediffusion
理解 o3 及其技术分析
1.2、如何理解o3的能力 大
模
型
的能力与人并不相同,o3可以完成一些常人很难胜任的工作,但也有很
多
对人简单的问题o3很难完成。
o3
技术分析
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
Whisper 是 OpenAI 研发并开源的一个自动语音识别(ASR,Automatic Speech Recognition)
模
型
,他们通过从网络上收集了 68 万小时的
多
语言(
语音
HeyGen
开源
Github2.1万星!开发者的“瑞士军刀” 开源!
它汇集了许
多
有用的工具和功能,这些工具和功能在软件开发和编程中经常被使用。
DevToys
工具集
开源
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
再比如具有前后因果的
模
拟也并不是每次都正确,如吃食物,不总是产生正确的食物状
态
变化。
视频生成
sora
AI拟声: 5秒内克隆您的声音
大牛开源了一个项目 mockingbird github 3万
多
星星!
声音克隆
开源
Stable Diffusion
还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
比如Stable Diffusion是一个
多
模
态
语言-图像
模
型
,LoRA可以学习将其语言表征迁移到图像modal中,从而获得跨
模
态
语义一致的表示。
SDXL
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
(2)传统的基于GAN的判别器在音频-口
型
同步检测方面准确率较低:传统的GAN判别器只使用单帧图像来评估口
型
同步,缺乏时间上下文信息,无法评估口
型
动
态
变化质量。
wav2lip
语音
开源
通过声音生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
具体来说,它分为三个部分: 人脸生成
模
型
:这个
模
型
可以从音频中生成逼真的人脸表情,包括嘴唇同步,眨眼,眉毛等细节。
audio2photoreal
开源工具
<
...
61
62
63
64
65
66
67
68
69
70
...
>
1
2
4
5
6
7
8
9
100