首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Stable Diffusion|提示词高阶用法(二)双人同图
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 收藏!万字长文聊聊LLM Agents的现状,问题与未来
· 50+ Midjourney 美食相关提示词,看了别留口水哦
· 苏秦(suqin) 语言大模型全工具链 WebUI 整合包
· 必看!ComfyUI故障应对指南,让您轻松应对每一个挑战
· 如何构建基于大模型的App
· BypassGPT-AI文本人性化
· 2023检索增强生成技术(RAG)研究进展
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
OpenAI Sora视频生成模型技术报告中英全文+总结+影响分析
ensp;Sora发布的潜在影响 ▎C端 / 对于普通人 •这或许是独立创作者最好的年代,Sora发布之后,文案、
音
效
sora
openai
视频生成
从0到1谈谈智能客服系统的设计与实现
· · 还能查找别的,比如视频、
音
频、动图、基因序列、搜索条目等。
智能客服
大模型
京沪“中国大模型第一城”争夺战爆发|钛媒体·封面
代表产品包括百度文心、抖
音
云雀、京东言犀、智谱AI ChatGLM、中科闻歌雅意、北京大学ChatLaw、第四范式的“式说”等,覆盖内容生成、智能问答、IT支持、数据分析、智能识别等多个场景应用。
大模型
钛媒体
LLM
收藏!万字长文聊聊LLM Agents的现状,问题与未来
能够以个人爱好定制语言风格和语
音
声线等。
LLM
Agents
万字长文-大语言模型指令调优综述
AL 分支包括一个预先训练的
音
频编码器(ImageBind (Girdhar 等人,2023))和一个
音
频Q-former。
大语言模型
【NLP技术分享】文本生成评价指标的进化与推翻
与 BLEU 不同,基于距离的评价方法是一种典型的 “错误率” 的度量,类似的思想也广泛应用于语
音
识别等领域。
开源模型
大模型
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
多模态模型:这些模型(如CLIP,Stable Diffusion, 或LLaVA)处理多种类型的输入(文本、图像、
音
频等),并使用统一的嵌入空间,这解锁了像文本到图像这样的强大应用。
LLM
大模型
GitHub
OpenAI
来自OpenAI应用研究主管关于Agent的万字长文-AI Agents介绍
特殊标记“-task_id”指的是具有任务ID为task_id的依赖任务中生成的文本图像、
音
频和视频。
Agent
大模型
从零开始了解AI大模型 - 技术篇:万字深度好文人话说大模型技术
编码器(Encoder)是神经网络中的一个组件,用于将输入数据(如文本、图像或
音
频)转换为中间表示(通常是向量或张量),以便模型能够理解和处理这些数据的信息。
大模型
阿里
[论文] 阿里提出AgentScope:灵活强大的智能体框架
多模态应用的广泛兼容性:随着大规模多模态模型的显著进展,AgentScope 支持多模态数据(例如文件、图像、
音
频和视频
AgentScope
语言大模型
智能体
大模型
九问中国大模型掌门人,万字长文详解大模型进度趋势
例如,现在很多用户连续刷抖
音
超过两个小时,这就是通过推荐模型,了解到每个用户画像、兴趣和痒点等等,结合在一起去兼容用户。
大模型
详解
开源
开源大语言模型完整列表
这些模型通常拥有数十亿到数万亿个参数,能够处理各种自然语言处理任务,如自然语言生成、文本分类、文本摘要、机器翻译、语
音
识别等。
开源模型
大语言模型
大模型
【全文翻译】微软166页论文解读 GPT-4V:多模态大模型的黎明
通过用诸如图像字幕生成器、对象检测器或用于文本到图像生成和
音
频到文本转换的训练有素的模型替换仅限于语言的插件,可以构建一个强大的多模态链与 LLMs 一起使用 [130, 135, 114, 107,
多模态大模型
GPT-4V
文生图
开源
国内外开源大语言模型一览表
这意味着,你将拥有一种超魔法,通过HuggingGPT,便可拥有多模态能力,文生图、文生视频、语
音
全能拿捏了。
大模型
<
...
27
28
29
30
31
32
33
34
35
36
>
1
2
4
5
6
7
8
9
100