首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 学会这招,一个头像变100种风格!
· AI写稿专家
· GenColor.ai
· 大模型评测新思路:弱智吧精华问题大全
· 最强开源数字人对口型系统介绍
· 除了深度换脸、模拟配音,还能口型匹配的AI软件出现了
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 文生图提示词prompt详解
· Stable Diffusion|提示词高阶用法(二)双人同图
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
prompt中的分隔符号的正确使用方法
这意味
着
正确使用分隔符号,能够帮助模型更准确地理解指令。
prompt
分隔符
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
参考帧包含目标人脸的完整外观特征,如嘴唇的形状、颜
色
和纹理等,用于唇部形状和运动的合成。
wav2lip
语音
数字人
一款构建AI数字人项目开源了!自动实现音视频同步!
当我们把爬虫任务交给 UserProxy 后,它会理解任务, 然后询问 Assistant 应该如何做,Assistant 会把操作过程告诉 UserProxy,接
着
UserProxy 会根据指示在本地安装依赖
AI数字人
音视频同步
Stable Diffusion
Stable Diffusion插件:提示词
别
着
急,支持翻译。
Stable
Diffusion
提示词
大模型
基于Ollama本地部署谷歌开源Gemma大模型!
Gemma 的名字来源于拉丁语 "gemma",意为“珍贵的石头”,象征
着
其在 AI 领域的重要价值。
ollama
gemma
qwen
StableDiffusion
StableDiffusion模型推荐系列(全能型)
这些模型背后,可是有
着
大量时间和资源的投入,比如SD1.5版本,耗资高达60万美元进行训练,其中的训练时间更是以万来计算的!
stablediffusion
sd
文生图
大模型
大模型训练为什么用A100不用4090
问题来了,如果 4090 这么香的话,为啥大家还要争
着
买 H100,搞得 H100 都断货了?
大模型
ComfyUI
SDXL 1.0 | 一文搞定 ComfyUI SDXL1.0 完整流程
2.绘图速度: ComfyUI 对 SD 的优化更好,这意味
着
在相同的硬件条件下,ComfyUI 可以实现更快的计算速度和更低的显存占用。
大模型
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的 AI Avatar
接
着
,PhotoMaker将与特定身份标识相关的图像的嵌入乘以一个系数,以控制其在新身份标识中的融合比例。
PhotoMaker
文生图
Transformer
如何最简单、通俗地理解Transformer?
删除残余连接意味
着
该信息在第一个注意层之后(初始化之后)丢失,并且使用随机初始化的查询和键向量,位置i的输出向量与其原始输入无关。
Transformer
大模型
GPTs
如何快速构建GPTs个人知识库应用?
随
着
技术的不断发展和完善,GPTs将为我们提供更多样化和个性化的智能解决方案。
GPTs
知识库
大模型
大模型时代-行业落地的再思考
随
着
业界把context window越做越大,prompt中可以放下越来越多的领域知识,直接用通用大模型也可以对领域问题有很好的回复。
大模型
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
随
着
人工智能技术的不断发展,相信PaddleOCR将在更多场景中发挥重要作用,为人们的生活和工作带来更多便利。
PaddleOCR
文字识别
ComfyUI
ComfyUI安装及生成第一张图
/venv/bin/python main.py 6、在 Mac 上更新 ComfyUI 在 comfyUI 文件夹中运行以下命令来更新 ComfyUI: git pull 三、试
着
跑一张图
ComfyUI
文生图
大模型
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
业界普遍认为,从单一感官的、仅支持文本输入的语言模型,到“五官全开”的,支持文本、图像、音频等多种信息输入的多模态模型,蕴含
着
大模型智能跃升的巨大可能。
大模型
<
...
63
64
65
66
67
68
69
70
71
72
...
>
1
2
4
5
6
7
8
9
100