首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· ComfyUI的特性以及安装流程
· 昆仑万维携Skywork-13B打造AI新纪元:600GB中文数据集全球开源
· 解读OpenAI Sora文生视频技术原理
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 17岁高中生写了个神级Prompt,直接把Claude强化成了满血o1。
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
解读OpenAI Sora文生视频技术原理
,xT是与x0具有相同维
度
的潜变量。
sora
比真人还像真人!字节跳动PersonaTalk的黑科技有多强大?
无论是微笑、说话,还是任何面部表情,视频中人物的嘴唇动作都和新配音的语音高
度
一致。
PersonaTalk
视频
ChatGPT
公司如何使用ChatGPT进行内容营销?
这些尖端技术使ChatGPT能够从事高
度
互动和上下文感知的内容创作,使其成为市场营销的宝贵资产。
大模型
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
推荐使用视频帧率为25fps,音频采样率为16k,视频的一帧对应音频块的长
度
为16。
wav2lip
语音
Prompt
大语言模型定制化应用的三种方式:Prompt engineering、Fine tuning、Pre-trainning的区别
这种方法适用于特定任务的应用,需要模型具备高
度
适应性和精
度
。
大模型
20%杨幂+80%霉霉=?这款“人脸拼接”的AI应用还能这么玩
用户只需提供一张面部图像,InstantID 就能在多种风格中生成个性化的图像,同时确保高保真
度
。
InstantID
文生图
Stable Diffusion
Stable Diffusion真实人物转卡通证件照(2.0版)
EasyNegativeV2 ng_deepnegative_v1_75t bad-image-v2-39000 迭代步数 (Steps):20 采样方法 (Sampler):DPM++ SDE Karras 宽
度
:
Stable
Diffusion
文生图
用户意图对齐,无需人工标注,Zephyr-7B 超越 Llama2-Chat-70B
基于 "今天是晴天,温
度
约为25°C。"
小型语言模型
Zephyr-7B
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
而OpenAI的Sora可以生成最多1分钟的视频(估计还能更长,很可能OpenAi在时间长
度
上做了限制,比如会员解锁更长)。
视频生成
sora
Google
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态估计
从MoveNet的技术博客分享中,我感受到Google在这方面的工程能力确实值得我们学习,它在两种范式之间取得了优秀的平衡,既避免了单独训练一个det模型,又尽量保留了单人姿态估计的精
度
优势。
MoveNet-SinglePose
Google
模型
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
为了做到这一点,作者的核心思想是用身份和细节高
度
相关的特征来表示目标对象,然后将它们组合到与背景场景的交互之中。
Anydoor
文生图
AI绘画Stable-Diffusion风格化实战
从具体的艺术家,画派,题材等多个维
度
对 Midjourney 的图片风格进行了分类和汇总,可以说是非常全面和系统的一个Midjourney样式参考库。
Stable-Diffusion
文生图
RAG
LLM应用架构之检索增强(RAG)的缘起与架构介绍
这一个致命缺陷就是prompt是有长
度
约束的,并且这一长
度
很难快速提高,因为它的增长带来的计算量(FLOPS)是呈O(n^2)增长的,具体推算逻辑可以查看:一文探秘LLM应用开发(12)-模型部署与推理
LLM
GPU 性能(数据表)快速参考
o FP代表浮点运算数据格式,包括双精
度
(FP64)、单精
度
(FP32)、半精
度
(FP16)以及FP8等,INT代表整数格式,包括INT8、INT4等。
GPU
算力
数字人
数字人:从科幻走向现实的技术革命
这使得数字人能够展现出与真人一样的动作和表情,增加了其真实感和可信
度
。
数字人
语音
<
...
38
39
40
41
42
43
44
45
46
47
...
>
1
2
4
5
6
7
8
9
100