首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· GenColor.ai
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· ComfyUI 基础教程(一)环境部署和插件安装
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· Suno音乐新手指南(手把手完整版教程)
· Midjourney AI绘画美女提示词分享一
· 火山写作
· 13个神级Chatgpt指令,助你小说丝滑过审
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
论文链接:https://arxiv.org/pdf/2311.07919.pdf 开源
代
码
:https://github.com/QwenLM/Qwen-Audio 引言 大型语言模型(LLMs
大模型
语音
企业
为什么说数智化可以帮助中小企业降本增效 ?
二、 一例安全事件引发的思考 昨天我看到一则消息,开源
代
码
编辑器 Notepad++ 发布 8.5.7 版,修复了此前被研究人员爆出的多个安全漏洞。
大模型
大模型
LLM大模型推理输出生成方式总结
当num_return_sequences参数设置大于1时,
代
码
会报错,说greedy search不支持这个参数大于1 Beam-search 方式:每一时间步选择num_beams个词,并从中最终选择出概率最高的序列
大模型
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
这种对视频和图像原有特征的深入洞察和保留,
代
表了在生成模型领域的一大进步。
Sora
微软
RAG
Langchain中改进RAG能力的3种常用的扩展查询方法
, } 下面
代
码
演示了如何使用Langchain进行Step Back Prompting #---------------------Prepare VectorDB--------------
检索增强生成
Langchain
Transformer
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
ViTPose和ViTPose+的性能和速度对比图,圆圈大小
代
表了模型大小 近年来,视觉transformer在多个视觉领域展现出了极佳的性能。
ViTPose+
Transformer
身体姿态
LLM
AutoGPT与LLM Agent解析
尤其在
代
码
生成场景中这个动作非常重要,否则无法实现长
代
码
的生成和执行。
大模型
Agent
2024年值得关注的Agent框架
论文链接: https://arxiv.org/abs/2304.04370 github链接: https://github.com/openAGI TaskWeaver: 是一个以
代
码
为先的框架
Agent
框架
ComfyUI
Comfyui工作流原理 你都了解吗
每个节点
代
表一个Stable Diffusion相关的模型或功能,节点之间通过连线传递图片信息。
Comfyui
工作流
ChatGPT
三个大模型(ChatGPT,文心一言,Baichuan-13B),帮我生成中医《本草纲目》的训练数据
代
码
逻辑这么简单,我就不写了,让大模型帮我写:) 一、三个大模型的生成
代
码
体验 1、ChatGPT3.5: 试了下,OK,运行成功,找到了关键的行。
大模型
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
此许可允许将OCRmyPDF与其他
代
码
(包括商业和封闭源
代
码
)集成,但要求您发布对OCRmyPDF所做的源
代
码
级修改。
OCRmyPDF
工具
RAG
高级 RAG 技术——图解概览
方案中的绿色部分
代
表我们将重点讨论的核心 RAG 技术,而蓝色部分则是文本。
RAG
检索
图解
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
项目主页-https://fun-audio-llm.github.io/
代
码
链接-https://github.com/FunAudioLLM/ 论文链接-https://arxiv.org
asr
tts
声音
Prompt
prompt必须知道的26条军规
23、当你有一个可能在不同文件中的复杂编
码
提示时:“从现在开始,每当你生成跨多个文件的
代
码
时,生成一个[编程语言]脚本,可以运行该脚本以自动创建指定文件或对现有文件进行更改以插入生成的
代
码
。
prompt
大模型
OpenAI
【语音识别】OpenAI语音力作Whisper
然后,transformer 编
码
器对声谱图进行编
码
,生成一系列编
码
器隐含状态。
语音转文字
whisper
<
...
20
21
22
23
24
25
26
27
28
29
...
>
1
2
4
5
6
7
8
9
100