首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· GenColor.ai
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· ComfyUI 基础教程(一)环境部署和插件安装
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· Suno音乐新手指南(手把手完整版教程)
· Midjourney AI绘画美女提示词分享一
· 火山写作
· 13个神级Chatgpt指令,助你小说丝滑过审
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
该模型旨在解决边缘设备在运行多模态模型时面临的资源受限问题,通过优化架构和
训
练
方法,实现了在保证性能的前提下,降低计算成本和延迟,从而为边缘设备的智能化升级提供了可行的解决方案。
OmniVision
-
968M
多模态模型
Stable Diffusion
读取大脑重建高清视频,Stable Diffusion还能这么用
整体来看,这个方法主要包含两大模块,它们分别做
训
练
,然后再在一起做微调。
stablediffusion
企业
【上篇】深度解析AI大语言模型(LLM)在企业应用的关键技术与典型架构
而从集成角度,在LLM出现之前,我们构建一个基于自然语言交互的AI应用,可能面临繁琐的配置与
训
练
过程,而最后的效果却不如人意,以
训
练
一个简单的天气查询机器人来说,其流程可能是这样的: 而现在,我们可以利用大模型轻松构建自然语言的交互界面
大语言模型
Stable Diffusion
全网最全AI绘画Stable Diffusion关键技术解析
ensp; · SD 1.2:引入大数据集LAION-2B进行
训
练
Stable
Diffusion
文生图
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
LLM) 构建的产品(例如 OpenAI 的 ChatGPT 和 Anthropic 的 Claude)非常出色,但也存在缺陷: 它们的数据集是静态的——大语言模型在静态数据集上进行
训
练
检索增强生成
大语音模型
大模型
七问大模型幻觉|LLM Hallucination
源与目标的差异:当我们在存在源与目标差异的数据上
训
练
模型时,模型产生的文本可能与原始源内容产生偏差
大模型
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
它提供了各种预
训
练
的模型,包括文本生成、文本分类、命名实体识别等多种NLP任务的模型。
Whisper
语音优化
Agent
Agent四大范式 | 综述:全面理解Agent工作原理
§ 而强化学习一般是构建策略网络或奖励模型,但是一般需要大量样本进行
训
练
,但是收集数据往往成本很高,所以这种方法可行性不大,很难推广开来。
Agent
大语言模型
大模型
链接大模型与外部知识,智源开源最强语义向量模型BGE
FlagEmbedding/tree/master/benchmark 值得大模型应用开发者关注的好消息:将 LangChain 与智源BGE结合,可以轻松定制本地知识问答助手,而不需要花较高的成本
训
练
垂类大模型
embedding
语义向量
阿里
本地运行140亿参数,阿里千问玩起来!Qwen+Win11+3060
Qwen-14B是基于Transformer的大语言模型, 在超大规模的预
训
练
数据上进行
训
练
得到。
大模型
开源
Stability AI开源上新:3D生成引入视频扩散模型
研究人员还改进了3D优化技术:采用由粗到细的
训
练
策略,优化NeRF和DMTet网格来生成3D对象。
sv3d
建模
开源
OCR是什么以及推荐几款开源中文OCR识别软件
第一名:PaddleOCR PaddleOCR 是百度开源的中文识别的ocr开源软件,PaddleOCR旨在打造一套丰富、领先、且实用的OCR工具库,助力开发者
训
练
出更好的模型,并应用落地。
OCR
RAG
RAG检索增强技术在知识库智能检索场景下的应用实践
与传统的大模型
训
练
相比,RAG(Retrieval-Augmented Generation)方法则不需要重新
训
练
整个大模型,而是通过外挂知识库来完成特定任务。
知识库
RAG检索增强
Github
8月份最火的 5 个 GitHub 项目
Qwen-7B是基于Transformer的大语言模型, 在超大规模的预
训
练
数据上进行
训
练
得到。
下载
清华
图片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
LCM的
训
练
过程也很高效,只需要大约32个A100 GPU的
训
练
时间,就可以完成对SD模型的蒸馏。
LCM/LCM-LoRA
文生图
<
...
21
22
23
24
25
26
27
28
29
30
...
>
1
2
4
5
6
7
8
9
100