首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· LLM Agent最常见的九种设计模式(图解+代码)
· 使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 你的下一个浏览器,可以是豆包电脑版!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大语言模型定制化应用的三种方式:Prompt engineering、Fine tuning、Pre-trainning的区别
· 第3期 SDXL和SD的10大区别!你知道几个?
· Stable Diffusion|背景替换只需要两分钟!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
GLM4 开源了!!!还有
多
模
态
长文本推理:支持最
大
128K 的上下文,GLM-4-9B-Chat-1M
模
型
更是支持高达 1M 的上下文长度。
智普
ChatGLM
多模态
开源
元象首个
多
模
态
大
模
型
XVERSE-V 开源,刷新权威
大
模
型
榜单,支持任意宽高比输入
人类获取的信息83%来自视觉,图文
多
模
态
大
模
型
能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向AGI(通用人工智能)迈出更
大
步伐。
XVERSE-V
多模态大模型
开源
构建开源
多
模
态
RAG系统
在这个新的冒险中,我们将深入研究使用开源
大
型
语言
多
模
态
(LLMM)构建检索增强
型
生成(RAG)系统的过程。
RAG
大模型
OmniVision - 968M:小巧精悍的视觉语言
模
型
,释放
多
模
态
边缘计算强
大
潜能
一、
模
型
概述 OmniVision - 968M是一款由NexaAI研发的紧凑且高效的
多
模
态
模
型
,其参数规
模
小于10亿(968M),却具备强
大
的视觉和文本处理能力。
OmniVision
-
968M
多模态模型
生成式AI与
大
语言
模
型
的区
别
如果它们听起来像是可比的,可能更像是生成
模
型
人工智能对
大
型
模
型
人工智能,或者可能是生成式语言
模
型
对
大
型
语言
模
型
。
生成式AI
大语言模型
区别
大
模
型
外挂知
识
库优化-
大
模
型
辅助向量召回
今天给
大
家带来一篇来自战士金
大
佬(@知乎战士金)的博文-
大
模
型
辅助向量召回。
大模型
被高估的Pika,被低估的
多
模
态
AI
“之前很
多
公司都在卷文本
大
模
型
,GPT-4V 的出现代表
多
模
态
大
模
型
可落地,毫无疑问明年
大
家都会卷
多
模
态
AI ,原因很简单,因为 OpenAI 说明这条路是能够走得通
大模型
多模态
你的下一个浏览器,可以是
豆
包
电脑版!
因为
豆
包
电脑版自带的很
多
新功能着实是有点东西在身上的。
豆包
浏览器
OCR
Windrecorder:连续记录屏幕内容,通过
OCR
技术
识
别
记录内容
(webui) 词云、时间轴、光箱、散点图的数据总结 录制完片段后自动
识
别
,闲时自动维护、清理与压缩视频
多
语言支持
Windrecorder
录屏
面向知
识
图谱的
大
模
型
应用
, 实现面向知
识
图谱的
大
模
型
应用。
知识图谱
大模型
达摩院SPACE对话
大
模
型
:知
识
注入与知
识
利用
②分角色
多
轮次,至少两个参与主体,轮次间存在省略、指代、状
态
继承、状
态
遗忘等。
大模型
开源
炸裂!百川开源第1个7B
多
模
态
大
模
型
Baichuan-Omni | 能够同时分析图像/视频/音频/文本
作者提出了一种有效的
多
模
态
训练
模
式,从 7B
模
型
开始,经过两个阶段的
多
模
态
对齐和
多
任务微调,分
别
针对音频、图像、视频和文本
模
态
。
Baichuan-Omni
多模态大模型
OpenAI
OpenAI
大
动作:Whisper large-v3重塑语音
识
别
技术
这款最新的自动语音
识
别
模
型
不仅在
多
语言
识
别
方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
工具
苏秦(suqin) 语言
大
模
型
全工具链 WebUI 整合
包
项目简介 本项目目标是实现目前各
大
语言
模
型
的全流程工具 WebUI 整合
包
。
大模型
开源
十
大
开源语音
识
别
项目
Whisper Whisper 是一个通用的语音
识
别
模
型
。
语音识别
开源项目
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100