文章列表-AI魔法学院

文章列表

大语言模型LLM和知识图谱KG增强的企业搜索应用

有一连串的想象：ChatGPT 是有史以来最好的东西，是我们见过的最强大的人工智能，它将消除人们工作中的苦差事，让学生摆脱家庭作业。

开源模型

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

AnyText 我之前也写文章介绍过了，专门针对中文，在生成的图片中能够很好的嵌入中文，而且还有强大的文字编辑功能。

阿里云视频音频

忘掉 RAG，未来是 RAG-Fusion！搜索的下一个前沿：检索增强生成遇上倒数排名融合和生成查询

可以诚实地说，最近出现的检索增强生成（RAG）技术是最具颠覆性的。

RAG-Fusion 检索增强

Stable Diffusion

Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法

之前虽然小视频生成比较火，不过出的视频都不太稳定，目前来看 AnimateDiff 是相对比较稳定的，而且能同时支持和其他插件一起使用。

动画 animate sd

Stable Diffusion

Stable Diffusion AnimateDiff | 最稳定的基于文本生成视频的方法！

之前虽然小视频生成比较火，不过出的视频都不太稳定，目前来看 AnimateDiff 是相对比较稳定的，而且能同时支持和其他插件一起使用。

文本生成视频 AnimateDiff

再次重点介绍！！！这款国内的AI制作视频工具

之前介绍过一款图片生成视频的工具-Flow Photo，99%的人不知道的一款国内的AI制作视频工具。

Flow Photo 视频

Rerank——RAG中百尺竿头更进一步的神器，从原理到解决方案

检索增强生成（RAG）是解决大语言模型（LLM）实际使用中的一套完整的技术，它可以有效解决LLM的三个主要问题：数据时效性、幻觉和数据安全问题（在我之前的文章《大模型主流应用RAG的介绍

RAG 检索增强

无需编码，轻松提升图像品质：探索ComfyUI的图像增强功能

无需编码，ComfyUI是一个强大且易于使用的解决方案，允许新用户和经验丰富的用户探索和构建复杂的StableDiffusion工作流。

文生图

超越Animate Anyone! 南加大&字节提出MagicPose，不需任何微调就可生成逼真的人类视频

南加州大学&字节提出MagicPose，一种新颖有效的方法，提供逼真的人类视频生成，实现生动的运动和面部表情传输，以及不需要任何微调的一致的野外零镜头生成。

MagicPose 视频

GPT-4o实时语音方案提供商Livekit开源voice agent：轻松处理音视频流

轻松访问 LiveKit WebRTC 会话并处理或生成音频、视频和数据流。

voice agent 开源音视频

用AI做郭德纲说英文相声的爆款视频（详细教程）

郭德纲用英文说相声的短视频火爆全网，单条视频点赞破9.7万，转发量更是高达11.8万，AI的内容形式层出不穷，不断地出爆款，其实这个两周前有出过教程--用这个AI，把视频翻译成30+种语言，丝滑程度，随时能把生意做到全世界

视频翻译语言

炸裂！百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本

跨模态交互数据为了增强模型跨模态交互能力，作者合成了一系列视觉-音频-文本跨模态交互数据，包括图像-音频-文本和视频-音频-文本数据集。

Baichuan-Omni 多模态大模型

爆火「视频版ControlNet」开源了！靠提示词精准换画风，全华人团队出品

“视频版ControlNet”来了！

ControlNet

一文看懂RAG：大语言模型落地应用的未来

以下是高级RAG的一些关键特点和创新：多模态支持：高级RAG不仅限于文本数据，还可以处理多模态数据，例如图像、音频和视频。

rag 检索增强

Roop参数说明，ROOP->StyleGAN演示！

1.人脸增强（enhance）人脸增强，也叫人脸修复。

视频 StyleGAN

<1 2 345 6 7 8 9 10 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1