首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 制作可爱的表情包
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 聊聊我对AI Agents技术的一些看法
· 文生图提示词prompt详解
· ComfyUI进阶前必备插件们续
· OpenAI视频模型Sora的推理生成成本多高?
· 盘点字节跳动最新的AI应用
· Suno歌曲制作
· 鹅厂最新AI工具刷屏!杨幂寡姐多风格写真秒秒钟生成,LeCun点赞 | 可免费体验
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
最佳开源文生图
大
模
型
可图:安装与批量出图的完整教程
Kolors可图是快手Kolors团队开发的基于潜在扩散的
大
规
模
文本到图像生成
模
型
。
可图
kolors
开源
OCR终结了?旷视提出可以文档级OCR的多
模
态
大
模
型
框架Vary,支持中英文,已开源!
以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多
模
态
大
模
型
Vary 直接端到端输出结果: 无论是中英文的
大
段文字
OCR
手写
文字识别
Agent
【万字长文】全球AI Agent
大
盘点,
大
语言
模
型
创业一定要参考的60个AI智能体
而
大
公司一边,面对
大
型
科技公司和创业公司都有可能抓住这次Agent的机会,比尔盖茨也表示如果
微
软没有介入他会感到失望。
大语言模型
开源
开源语音
大
语言
模
型
来了!阿里基于Qwen-Chat提出Qwen-Audio!
以前关于遵循指令的工作主要是通过继承
大
型
(多
模
态)LLMs的能力,采用轻量级的监督
微
调
来激活
模
型
的能力以与用户意图对齐。
大模型
语音
企业
大
语言
模
型
LLM和知识图谱KG增强的企业搜索应用
微
软有了 ChatGPT,他们把它放到了 Bing 中,这真是太神奇了。
开源模型
智谱AI静悄悄的上线了一
大
波新
模
型
,过年了,真的
我挨个列一下:
大
语言
模
型
GLM-4-Plus。
智谱AI
大模型
微
软打破Decoder-Only架构!
大
幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
微
软&清华最新研究,打破GPT系列开创的Decoder-Only架构—— 提出Decoder-Decoder新
型
架构,名为YOCO(You Only Cache Once)。
Decoder-Decoder
YOCO
架构
造梦师手记:C站最受欢迎的
大
模
型
推出了SFW版
很长一段时间,C站最受欢迎的
大
模
型
是DreamShaper,在SDXL推出后,作者Lykon第一时间推出了一个0.9版和1.0版。
DreamShaper
大模型
文生图
大
模
型
的最
大
bug,回答正确率几乎为零,GPT到Llama无一幸免
所以说,
大
模
型
的推理,其实并不存在?
大模型
开源
炸裂!百川开源第1个7B多
模
态
大
模
型
Baichuan-Omni | 能够同时分析图像/视频/音频/文本
作者提出了一种有效的多
模
态训练
模
式,从 7B
模
型
开始,经过两个阶段的多
模
态对齐和多任务
微
调
,分别针对音频、图像、视频和文本
模
态。
Baichuan-Omni
多模态大模型
人工智能
AI人工智能
大
模
型
通用办公提示词-献给像我一样的社畜们
强
调
急迫感: Refine the existing document by adding a sense of urgency and emphasizing the need for immediate
数字人
体验了几款AI工具&&最新出现的跟数字人相关的几款
大
模
型
图生成3D
模
型
ImageDream: https://image-dream.github.io/ 可以从多个角度生成。
数字人
大模型
文生图
RAG
一文看懂RAG:
大
语言
模
型
落地应用的未来
做
大
模
型
的人都知道
微
调
成本是十分高的,而RAG检索能力会消耗更低的成本并且收获比
微
调
更好的效果!
rag
检索增强
动作识别
模
型
有哪些
动作识别
模
型
主要有: · TWO-STREAM CNN:网络顾名思义分为两个部分,一部分处理RGB图像,一部分处理光流图像。
动作识别
模型
全球最强长文本
大
模
型
,一次可读35万汉字:Baichuan2-192K上线
大
模
型
看书,从来没有这么快过。
Baichuan2
百川
开源
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100