首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 为你推荐开源项目:Meridian——专属个人情报站!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 国内外开源大语言模型一览表
· 如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator,一键计算大模型显存需求
· 阿里Qwen3系列模型惊艳亮相
· 国产视频制作之光-可灵:提示词大全整理
· 推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 中学生也能看懂的Sora视频生成原理解读
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
训
练
流程优化 多阶段
训
练
策略:OmniVision - 968M采用了精心设计的三阶段
训
练
流程。
OmniVision
-
968M
多模态模型
RAG
一文看懂RAG:大语言模型落地应用的未来
特别是当查询超出模型的
训
练
数
据
或需要最新信息时。
rag
检索增强
Stable Diffusion
Stable Diffusion ComfyUI 入门感受
介绍: ComfyUI 是一个基于节点流程式的stable diffusion AI 绘图工具WebUI, 你可以把它想象成
集
成了stable diffusion功能的substance designer
文生图
最顶尖的大语言模型人才,只关心这10个挑战
基于文本的模型需要大量的文本
数
据
,现在我们确实在担心用于
训
练
基于文本模型的互联网
数
据
会被耗尽。
大语言模型
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
最终,作者以实际测试
数
据
展示了不同优化方式的速度对比。
音频
Whisper
大模型
大模型应用中大部分人真正需要去关心的核心——Embedding
对于像图书类型这样的类别,随着更多的类型被添加到
数
据
集
中,这种稀疏性将会呈指
数
级恶化。
大模型
大模型
国内AI大模型已近80个,哪个最有前途?
高质量
数
据
在大模型
训
练
中是非常关键的。
大模型
ChatGPT
从 ChatGPT 系统提示中,分享几个拿来就能用的prompt提示工程技巧
ChatGPT的强大毋庸置疑,特别是GPT4里面的
数
据
分析、DALL.E 3图片生成等功能,以及近期推出的GPTs功能,这些官方公布的功能都是由他们自己内部的模型开发人员编写的提示词构成的。
ChatGPT
prompt
Sora
Stablediffusion3论文下载-确定了Stablediffusion3与Sora的架构是一致的
我们
训
练
的模型从带有 450M 个参
数
的 15 个图块到带有 8B 个参
数
的 38 个图块不等,并观察到验证损失随着模型大小和
训
练
步骤的增加而平稳减少(上排)。
SD
论文
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
为了改进模型的性能,作者还引入了一种新的损失函
数
,用于在
训
练
过程中对生成图像进行优化。
大模型
文生图
ChatGPT
10个值得收藏的ChatGPT辅助编程技巧
你需要承认 ChatGPT 已经使用 2021 年之前的公开
数
据
进行了
训
练
。
编程
提示词
chatgpt
大模型
AI+智能客服:大模型可落地的最成熟场景之一
模型偏见和伦理问题:AI大模型可能会从
训
练
数
据
中学习到偏见,并在提供服务时无意中体现这些偏见。
ai
客服
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、录音和病历文本,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器
数
据
,带来更智能、更安全的自动驾驶体验;在教育领域,将文本、声音、视频相结合,呈现更具互动性的教育内容
大模型
多模态
企业
检索增强生成(RAG):LLM企业级应用落地的挑战与思考
包括
训
练
语言模型时的
数
据
过滤,在线内容审查,块列表封禁等。
大语言模型
RAG检索增强
Stable Diffusion
读取大脑重建高清视频,Stable Diffusion还能这么用
整体来看,这个方法主要包含两大模块,它们分别做
训
练
,然后再在一起做微调。
stablediffusion
<
...
33
34
35
36
37
38
39
40
41
42
...
>
1
2
4
5
6
7
8
9
100