首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MCP服务介绍及应用场景报告-来自Manus
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 掌握Prompt的6心法
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· videomaker.me
· 火山写作:一款助力写作能力提升的AI助手
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 5 种策略控制 ChatGPT 的输出长度
· 中文通用大模型最全汇总
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
Stability AI开源上新:3D生成引入视频扩散模型
这样的成果,引发了不少网友的
感
慨: 可以想象,在未来6-12个月内,3D生成技术将会被用到游戏和视频项目中。
sv3d
建模
换脸
AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
不要暴力白嫖,涸泽而渔不是好事
情
。
FaceFusion
Roop
AI换脸
SDXL
A1111 终于支持最先进 SDXL ControlNet!安装方法看这里~
需要注意的是,到目前为止,所有发布的 ControlNet 模型均不是官方模型,即不是 sd1.5 ContronNet 发布者发布的模型,所以会存在质量参差不齐的
情
况,使用的过程中要注意这一点。
大模型
SDXL
ControlNet
大模型
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
为了解决这些问题,OpenAI 成立了一个基础团队,以研究如何在新训练数据不断减少的
情
况下继续改进其模型的新策略。
Scaling
Law
AI大模型
大模型
大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免
虽然将逆转诅咒与逻辑演绎联系起来很有用,但它只是对整体
情
况的简化。
大模型
Transformer
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
ViTPose+进一步拓展到多种不同类型的身体姿态估计任务,涵盖动物、人体以及典型的身体骨骼、手、脚、脸部等关键点类型,在不增加推理阶段模型复杂度和计算复杂度的
情
况下,实现了多个数据集上的最佳性能。
ViTPose+
Transformer
身体姿态
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
AI 生成专属头像 去年 Midjourney 和 Stable Diffusion 这两款 AI 绘画神器一经发布,让诸多专业摄影师、设计师、艺术创作者都倍
感
震撼。
开源模型
大模型
中文原生文生图大模型来了!腾讯混元推出,Sora 同架构
评测结果显示,新一代腾讯混元文生图大模型视觉生成整体效果,相比前代提升超过 20%,在语义理解、画面质
感
与真实性方面全面提升,在多轮对话、多主体、中国元素、真实人像生成等场景下效果提升显著。
文生图
混元
腾讯
RAG
RAG 2.0来了,它能成为生产落地的福音吗?
从优化思路和最终效果上看,RAG 2.0确实能够给开发者一些启发,端到端地进行优化,值得一提的是Contextual AI 不仅有上下文语言模型(CLMs)还有微调和对齐技术(例如GRIT、KTO和LENS),
感
兴趣的可以了解
RAG
大模型
Stable Diffusion
Stable Diffusion 常用LoRA模型推荐
有些模型争议较大,因此需要大家根据自身实际需求和
情
况自行下载(记得科学上网哦~),但是切记不要用于网络诈骗、传播黄色淫秽作品等非法目的。
文生图
SD
换脸
WebUI使用用InstantID,AI换脸完美版
Embedding:团队利用预训练的面部识别模型代替 CLIP 来提取语义人脸特征,并使用可训练的投影层,将这些特征映射到文本特征空间,形成 Face Embedding,具有丰富的语义信息,包括如面部特征、表
情
、
换脸
小红书
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
这样,在参数仅增加 8% 的
情
况下,速度提高了 2 倍,同时输出结果与 Whisper 完全相同。
语音
HeyGen
Stable Diffusion
【ComfyUI】Blender+Stable Diffusion!少年啊,这盛世如你所愿!(附中文汉化插件)
想不到研究了blender这么久,终于等到了AI绘画和blender结合的一天,不得不
感
叹一句:少年啊,这盛世如你所愿!
开源模型
Meta
学术党狂喜,Meta推出OCR神器,PDF、数学公式都能转
理想
情
况下,预测将形成阶梯函数,但在实践中,信号将有噪音。
大模型
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
•从普通PDF生成可搜索的PDF/A文件 •在图像下方准确放置OCR文本,以便于复制/粘贴 •保持原始嵌入图像的确切分辨率 •在可能的
情
况下
OCRmyPDF
工具
<
...
63
64
65
66
67
68
69
70
71
72
...
>
1
2
4
5
6
7
8
9
100