首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI换脸工具:facefusion使用心得
· 大模型能力快速测评极简题目
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· Stable Diffusion基础:ControlNet之身份标识
· 国内法律类大模型介绍
· 秘塔AI搜索
· 会议纪要类提示词大全-最全会议纪要prompt
· AI创作 |如何通过GPT进行漫画视频的故事改写
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
无限长的上下文,也干不掉的RAG
研究背景 随着语言模型的发展,它们在多种
用
户
面向的语言技术中扮演着越来越重要的角色,如对话系统、搜索与摘要、协作写作等。
RAG
大模型
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!!
简而言之,这款模型在保持高效能的同时,通过大幅降低成本和资源需求,拓宽了其使
用
场景和
用
户
群体。
Phi-3
Mini
人工智能
Prompt
写不好Prompt?可以先写个粗糙版本,然后让GPT帮助优化。
这个版本的Prompt更加专注于实际应
用
和成为领域内专家的目标。
Prompt
GPT
RAG
Qwen2.5更新百万超长上下文,推理速度4.3倍加速,网友:RAG要过时了
上下文能力扩展不影响性能 除了一口气啃下3本长篇小说,Qwen官方还展示了Qwen2.5-Turbo超长上下文的更多实
用
功能。
Qwen2.5
开源模型
大模型
如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator,一键计算大模型显存需求
这个工具估算大模型最小推荐显存资源的方式是
用
最大层的大小(the minimum recommended vRAM)来表示的。
大模型
智谱AI静悄悄的上线了一大波新模型,过年了,真的
毕竟这也算是国内首个通
用
视频理解模型 API。
智谱AI
大模型
Agent
AI Agent的数字化革命:超越文本,走向自主决策与交互
强调了如规划、记忆和工具使
用
等关键组件。
生成式AI
开源
语音、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的语音识别模型,它是一种通
用
的语音识别模型,可以
用
于语音识别、语音翻译和语言识别等任务。
人工智能
大模型
wisper
Stable Diffusion
全网最全AI绘画Stable Diffusion关键技术解析
SD1.x 系列,大多数是在 SD1.2 的基础上继续微调得到的,包括我们使
用
最多的 SD1.4 和 SD1.5 模型;SD2.x 系列则是新开的故事线,使
用
了全新的模型结构。
Stable
Diffusion
文生图
模型压缩:量化、剪枝和蒸馏
量化是一种通
用
的压缩方法,适
用
于几乎所有的深度模型,学术界已经证实,全连接层是对量化操作十分友好的结构,而BERT 中大部分模块都由全连接层组成,因此BERT 对于量化操作是比较友好的。
BERT
语言模型
工具
FFmpeg之父新作——音频压缩工具 TSAC
其原理和我们之前介绍的突破压缩极限的AI语音编解码器类似,使
用
深度学习网络进行压缩,TSAC这里引入Transformer结构来提升性能。
TSAC
音频工具
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
为了让 JoyHallo 模型适应普通话,采
用
了中文的 wav2vec2 模型来提取音频特征。
JoyHallo
数字人
开源模型
Stable Diffusion
SD入门教程一:Stable Diffusion 基础(技术篇)
首先,
用
户
输入的 Prompt 会被一个叫Text Encoder(文本编译器) 的东西编译成一个个的词特征向量。
Stable
Diffusion
文生图
超越Claude-2.1和GPT-3.5-Turbo,Qwen1.5还藏了哪些黑科技?32K Tokens上下文支持只是开胃菜!
我们
用
先进的策略优化技术,让Qwen1.5更贴合人类思维。
Qwen1.5
开源模型
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
通过使
用
Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。
音频
Whisper
<
...
71
72
73
74
75
76
77
78
79
80
...
>
1
2
4
5
6
7
8
9
100