首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 解读 | SuperCLUE 2023年9月全面测评大模型四大能力
· ComfyUI初学者指南
· 吐司
· [Stable Diffusion]AnimateDiff :最稳定的文本生成视频插件
· AnimateDiff:一篇文章教你学会用Stable Diffusion制作GIF动图
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 大模型能力评估体系
· 基于秋叶整合包-StableDiffusionWebUI启动器快速安装ComfyUI
· 史上最好的中文大预言模型出现了!!!
· Stable Diffusion | 常见问题清点汇总
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
SD 美颜修图神器
— 该插件需
要
从网址进行安装,插件地址: https://github.com/portu-sim/sd-webui-bmab 进入 SD 的扩展,通过网址进行安装。
SD
文生图
科大讯飞
哈工大科大讯飞联合推出中文LLaMA-2 & Alpaca-2大语言模型
本项目主
要
内容: 针对Llama-2模型扩充了新版中文词表,开源了中文LLaMA-2和Alpaca-2大模型 开源了预训练脚本、指令精调脚本,用户可根据需
要
进一步训练模型
训练
下载
造梦师手记:重新定义真实,SDXL下载量最大的真人模型
留在AI绘画领域的,
要
么是沉浸其中的痴迷爱好者,
要
么是专业领域已经开始使用AI绘画进行生产力替代的使用者。
文生图
SDXL
RAG
超越RAG:揭秘IAG框架如何引领推理问答系统的创新之路
方法改进 与传统的基于预训练模型的问答系统相比,IAG框架的主
要
优势在于其增强了系统的事实准确性。
IAG框架
大语言模型
自动化神器Autolt:不再重复工作
这是一个简单的演示,实际使用时,你可能需
要
根据你的需求进行更复杂的操作。
RPA
自动
开源
来个优秀的开源人脸识别项目!
生物识别技术在安全、金融、医疗、安防等领域具有广泛的应用前景,随着技术的不断发展和市场需求的日益增长,生物识别技术将发挥越来越重
要
的作用。
人脸识别
开源项目
OpenAI
基于 OpenAI Whisper 模型的实时语音转文字工具
WhisperLive 的主
要
特点包括: 1.
WhisperLive
音频
开源软件
SDXL
总结些SDXL出人像时遇到的困难
模型很难出流泪的场景
要
么是流的泪很混乱,参考我的SDXL出的几张图: 就没有真实流泪的感觉,都是很杂乱的泪~ 用1.5的墨幽模型也出着试试: 这张还像那么回事
文生图
SDXL
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
这种模型可以用单语言的语音-文字数据集来训练,不需
要
有双语言的语音数据集。
Translatotron
语音识别
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
import paddleocr 3.准备数据集:为了使用PaddleOCR进行文字识别,用户需
要
准备包含文字图像的数据集
PaddleOCR
文字识别
Python
Python几种常见算法汇总
示例1 假设我们有一个列表[3, 1, 4, 1, 5, 9, 2, 6, 5, 3],我们
要
使用快速排序算法将它排序: arr = [3, 1, 4, 1, 5, 9, 2, 6, 5, 3]
编程
python
算法
Stable Diffusion
17/180 Stable diffusion 抽卡神器 dynamic prompts (二)
stable-diffusion-webui/extensions/sd-dynamic-prompts/wildcards 集合目录包含各种修饰符库 每种提示词库包含各种词汇 可以进行随机抽词 就不需
要
自己写了
文生图
文生图
Sora
Stablediffusion3论文下载-确定了Stablediffusion3与Sora的架构是一致的
在这些测试中,人类评估员从每个模型中获得输出示例,并
要
求他们根据模型输出在多大程度上紧跟所给提示的上下文("紧跟提示")、在多大程度上根据提示渲染文本("排版")以及哪幅图像具有更高的美学质量("视觉美学
SD
论文
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
主
要
功能包括: · 支持多种声音变化 AI § MMVC § so-vits-svc § RVC(Retrieval-based-Voice-Conversion
AudioCraft
音频
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
通过减少图像标记数量,模型在处理图像时所需的计算资源和时间大大降低,有效缩短了延迟时间,提高了整体运行效率,从而使模型能够在边缘设备上更加流畅地运行,满足实时性
要
求较高的应用场景。
OmniVision
-
968M
多模态模型
<
...
89
90
91
92
93
94
95
96
97
98
>
1
2
4
5
6
7
8
9
100