首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 绝了!新华社、知网官方出品的写作神器,不要太爽!
· 被低估的面壁:打造出不输 OpenAI 的 Scaling Law 曲线
· AI文本转语音工具(TTS):MeloTTS
· AI+大模型在金融行业的应用场景
· 一文带你看懂OpenAI-Sora生成视频的原理
· SD入门教程二:文生图基础用法(提示词)
· 一人搞定30万商品分类:AI落地实践故事!
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· GenColor.ai
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
俄罗斯人开源了最大的文生图模型:参数量12B,比SDXL大了3倍多!
Kandinsky 2.2之后,俄罗斯AI研究团队AI Forever又开源了新的文生图模型Kandinsky-3,这个模型最特别之处时采用了一个超大的text encoder(参数量为8.6B),导致模型
总
参数达到了
Kandinsky-3
文生图
开源模型
斯坦福宣布前端开发要失
业
了?!一张截图生成代码,64%优于原网页!
对模型进
行
了微调,以提高其在我们基准测试中的性能,并与商
业
API模型进
行
了比较。
设计转代码
大模型
开源
世界上最流
行
(github排名高)的开源移动机器人的操作系统ROS开源了!!
总
的来说,TurtleBot3是一款功能强大、灵活多变的移动机器人,适用于教育、研究、产品原型和爱好应用等多种场景。
ROS
机器人
开源模型
LLM
【上篇】深度解析AI大语言模型(LLM)在企
业
应用的关键技术与典型架构
§ 输出侧:强大的自然语言生成能力 大语言模型则在语义理解的基础上,具备了强大的自然语言推理、决策与生成能力,具体表现在文本内容的
总
结
、归纳、整理、对比、摘要、转换、创作、分析等能力与
行
为
大语言模型
微软
微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运
行
总
的来说,自解码器和交叉解码器的模块设计与Transformer的解码器层类似,包含交错注意力和前馈网络子层。
Decoder-Decoder
YOCO
架构
教程
保姆级教程:Coze 打工你躺平
最近在玩 Coze/扣子 发现这事无需代码,人人都
行
比如,链接丢过去,工作
结
束,下班!
Coze
教程
开源
来个优秀的开源人脸识别项目!
生物识别技术是一种利用人体自身特征进
行
身份认证的技术。
人脸识别
开源项目
大模型
OCR终
结
了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出
结
果: 无论是中英文的大段文字
OCR
手写
文字识别
盘古
华为盘古画画3.0发布 | PanGu-Draw:
业
界最大的中文文生图模型,效果YYDS!
如图1(c)所示,
结
构生成器负责在较大的时间步长范围内进
行
早期去噪,特别是在, 其中;这个阶段的重点是建立图像的基本轮廓。
PanGu-Draw
文生图
Sora
Sora懂不懂物理世界?
我们真实的视频是会体现 真实世界的物理规律,以航
行
为例这意味着 AI 需要考虑到重力、浮力、碰撞以及船体
结
构在动态环境中的
行
为。
文生视频
视频生成
sora
揭秘DeepSeek:一个更极致的中国技术理想主义故事
中国的7家大模型创
业
公司中,DeepSeek(深度求索)最不声不响,但它又
总
能以出其不意的方式被人记住。
DeepSeek
大模型
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进
业
务!
一句话
总
结
就是:RAG = 检索技术 + LLM提示。
OCR
RAG
开源
一个充满多智能体的数字社会正在浮现,商
业
的底层逻辑已进入重构倒计时
如果我们要提前未来的社会形态如何,未来的商
业
规律如何,我们必须深刻理解,什么是多智能体,多智能体如何更好地帮助人类实现自动化工作,如何帮助整个社会如何做出更好地发展决策?
大模型
RAG
Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
这不,刚在写代码这事儿上刷新SOTA,Qwen2.5系列又双叒突然更新了—— 一口气读三本《三体》不费事,并且45秒左右就能完整
总
结
出这69万token的主要内容, 还真不是糊弄事儿,“大海捞针”实验显示
Qwen2.5
开源模型
大模型
大模型训练为什么用A100不用4090
先说
结
论,大模型的训练用 4090 是不
行
的,但推理(inference/serving)用 4090 不仅可
行
,在性价比上还能跟 H100 打个平手。
大模型
<
...
9
10
11
12
13
14
15
16
17
18
...
>
1
2
4
5
6
7
8
9
100