首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI声音克隆 | 最全最简教程(权威版)
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 开源版妙鸭相机来了,无限出个人写真图(阿里达摩院出品)
· 替代画师?不,AI把枪指向了商业摄影
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· 通俗易懂地解释OpenAI Sora视频生成的特点有哪些?它与此前的Runway Gen2、Pika有什么区别?以及缺点是什么?
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· 解读wav2lip:探究语音驱动唇部动作的技术原理!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
而切镜完的效果,确实张
力
好一些。
sora
视频生成
ComfyUI
ComfyUI官方使用手册【官网直译+关键补充】
典型的用例包括向模型添加生成某种风格的能
力
,或更好地生成某些主题或动作。
文生图
图生图
comfyui
Stable Diffusion
Stable Diffusion高级教程 - 图生图(img2img)模式
接着我们试试完全从零画一幅画 (叫「涂鸦」更合适),为了展示 SD 的厉害之处,我特意选择了一个「复杂」的构图,在本灵魂画手非常努
力
作画后,看一下生成图的效果这样的: 注意哈,因为这个模式需要上传图
Stable
Diffusion
图生图
AIGC
AIGC系列之一-一文理解什么是Embedding嵌入技术
4、泛化能
力
: 在实际问题中,我们经常需要处理一些在训练数据中没有出现过的数据。
AIGC
Embedding
嵌入技术
Midjourney
10大Midjourney描述词网站,让你Ai创作随心所欲!
加入该词可以大大改善图像的色彩对比和细节 Vivid Colors 给图片添加鲜艳的色彩,可以为你的图像增添活
力
描述词
文生图
ChatGPT
用ChatGPT写论文prompt大全
这可以帮助读者更好地理解你的观点,并增加你的论文的说服
力
。
prompt
如何从零开始训练专属 LoRA 模型?4600字总结送给你!
优点:不用处理 tags 省时省
力
,过拟合的出现情况低。
训练
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
最大间隔损失的原理是基于最大间隔分类器的思想,通过最大化类别之间的间隔来提高分类器的鲁棒性和泛化能
力
。
wav2lip
语音
Stable Diffusion
Stable Diffusion ComfyUI 入门感受
comfyui一直没能重现webui生成的图片 直接拖动过来,就能重现出当时的节点网络和流程 插件: “在AI绘图这个不成熟而又在疯狂发展的领域里面,敢于大量并持续的投入时间和精
力
进行开发的人们
文生图
大语言模型的拐杖——RLHF基于人类反馈的强化学习
为什么语言模型在学习世界,学习概念、人和已知过程的惊人能
力
要强得多,但输出的结果却并不如人们所希望的那样好,或者说不如它们本应该可以的那样好。
大模型
训练
开源
30 多年前被 Windows、Linux “灭掉”的操作系统 MS-DOS 4.0,微软在 GitHub 上开源了!
事实证明,这是一次极其幸运的运气,再加上一些精明的商业洞察
力
,最终使微软公司成为世界上最大的公司之一,比尔·盖茨也多年来一直是世界上最富有的人。
MS-DOS
4.0
开源模型
微软
AI绘画当前的应用场景有哪些?
这可以提高蒙版创建过程的效率和准确性,从而可能获得更高质量的修复结果,同时节省时间和精
力
。
文生图
动作识别模型有哪些
Slow分支的帧采样更稀疏,因此会更侧重不变的语义(空间信息),而Fast 分支的帧采样更密集且通道数更少(限制了表达能
力
),因此会更侧重变化(语义)的语义。
动作识别
模型
LLM
LLM Agent最常见的九种设计模式(图解+代码)
是的,就是这么简单,在论文的开头作者也提到人类智能的一项能
力
就是 Actions with verbal reasoning,即每次执行行动后都有一个“碎碎念(Observation”:我现在做了啥,是不是已经达到了目的
LLM
Agent
图解
大模型
使用大模型自动回复小红书/抖音/快手评论:通过RAG 优化LLMs实现
大型语言模型(LLMs)已经展示出了令人印象深刻的能
力
,可以存储和部署大量知识以响应用户查询。
RAG
大模型
自动回复
<
...
62
63
64
65
66
67
68
69
70
71
>
1
2
4
5
6
7
8
9
100