文章列表-AI魔法学院

文章列表

QAnything：网易有道最新开源的“本地化部署知识库”AI问答系统

如果想要分别使用嵌入和重排功能，请参考BCEmbedding LLM。

网易 RAG 知识库

AI自动生成视频全流程干货

过程会有点漫长，需要等待几分钟，而且文字转化视频对于文字的长度有限制，所以如果你脚本太长了，可以考虑分段生成，然后自己再组合再一起。

AI 视频

ComfyUI初学者指南

在本教程结束时，您将有机会制作一个非常复杂的教程。

文生图 comfyui

为什么大佬都在说Agent是未来？换个角度来谈一谈

LLM：能够生成“无法考证可能正确”以及“不一定及时”的相关行程攻略，景点等信息。

Agent 大模型

AI绘画：InstantID Win11本地安装记录！

可以参考以往的文章。

InstantID Win11 安装

Qwen7b微调保姆级教程

所以，总共是有 27个样本。

Qwen7b 大模型

使用python调用comfyui-api，实现出图自由

就可以设置对应的参数，在函数中解析替换这个键值我在最后还设置了一个文件'prompt.xlsx'，方便写入大量的prompt进行替换这样就可以解放双手，996的压榨显卡啦（不是） 3、参考来源

comfyui 工作流

两天star量破千：OpenAI的Whisper被蒸馏后，语音识别数倍加速

other=arxiv:2311.00430 此外，有项测试结果表明，在处理 150 分钟的音频时，Distil-Whisper 的速度可以达到 Faster-Whisper 的 2.5 倍。

语音 HeyGen

阿里Outfit Anyone实现真人百变换装

然而，现有方法往往难以生成高保真度和细节一致的结果。

Outfit Anyone 阿里

用so-vits-svc-4.1进行音色转换的极简教程

注意：推理上传的歌曲同样需要进行人声分离，离线工具可以考虑UVR5，在线服务可以选择，但是每天有1-2次免费机会： https://vocalremover.org/zh/cutter 推理完成后

声音 sovits

Stable Diffusion

Stable diffusion又一个电商换装/换模特辅助插件

今天继续玩换装分享一款辅助插件 Inpaint anything 这个插件结合了 segment anything 进行蒙版提取在segment anything

Stable diffusion 文生图

Mokker，想取代商业棚拍效果的场景生成AI

Mookker有两个特点非常吸引人，一是因为需要上传产品图片，所以产品在生成式的AI结果中是非常准确的，不会受AI生成影响产品的结构和内容，如果没有时间抠图，上传后也会贴心帮您抠好图；二是添加摄影道具的时候可以布局前后和位置关系

Mokker 图生图

惊艳！2.77亿参数锻造出Agent+GPT-4V模型组合，领航AI领航机器人、游戏、医疗革新，通用智能时代你准备好了吗？

结合经验丰富的护士提供的视频字幕和临床文档，模型在医疗任务中的表现得到了显著提升，特别是在视频字幕生成、视觉问答和RASS评分预测等方面。

Agent+GPT-4V 大模型

OCRmyPDF—可智能识别PDF文本和图片信息的工具

引用更多信息请参考：https://github.com/ocrmypdf/OCRmyPDF?

OCRmyPDF 工具

Giraffe：世界上第一个商业可用的32K长上下文开源LLM（基于Llama-2）

在这里，我们分享一些结果以及培训和评估脚本，希望对社区有用。

开源模型

<...79 80 81 828384 85 86 87 88 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1