文章列表-AI魔法学院

文章列表

Langchain中改进RAG能力的3种常用的扩展查询方法

我们这里主要介绍在Langchain中常用的3种方法查询扩展技术涉及对用户的原始查询进行细化，以生成更全面和信息丰富的搜索。

检索增强生成 Langchain

一款构建AI数字人项目开源了！自动实现音视频同步！

video-retalking/blob/main/quick_demo.ipynb 项目地址：https://github.com/OpenTalker/video-retalking 系统为实现这一目标，分解为三个连续的任务

AI数字人音视频同步

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

Erwin_8.wav|Erwin|ZH|就必须像一个一流的诈骗犯一样 Erwin_9.wav|Erwin|ZH|对他们花言巧语一番可以看到，除了语气特别强烈的素材，大部分都没有进行标点符号的标注

Whisper 语音优化

ChatGPT提示工程 - 总结

ChatGPT提示工程的两个关键原则 - 吴恩达和OpenAI合作编写Prompt的两个关键原则原则一：编写清晰、具体的说明策略1：使用分隔符清晰地标识出输入的各个部分策略2：提示模型以结构化格式输出结果

GPT

AI 绘画新时代：ChatGPT + DALL-E 3

现有用户基础：ChatGPT 享有庞大的用户基础（1 亿用户），相较于 MidJourney（1600 万用户）分发优势显著。

文生图图生图 chatGPT DALL-E

Stable Diffusion

新手向，Stable Diffusion API 接口，在本地调用

如果结果是：{'detail': 'Not authenticated'} 那么你应该是用的一键启动包进行登录，或是在别的地方设置了用户名和密码，解决方法如下： &

SD 文生图

如何下载及使用通义千问7B开源大模型

studios/qwen/Qwen-7B-Chat-Demo/summary 环境配置与安装本文在ModelScope的Notebook的环境（这里以PAI-DSW为例）配置下运行

通义千问

chatglm3基础模型多轮对话微调

/chatglm3-6b-base"的路径进行调用。

ChatGLM 微调

ComfyUI安装及生成第一张图

双击运行下载的exe文件。

ComfyUI 文生图

Stable Diffusion

AnimateDiff：一篇文章教你学会用Stable Diffusion制作GIF动图

提示词相关性（CFG Scale）：7.5 - 8 对于其余的配置，使用默认设置就行。

AnimateDiff 视频训练

AI面部增强器-Remini

当然，要看画质增强还是得用彩色图片才行。

Remini 面部增强修复文生图

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

F5-TTS在公共的100K小时多语言数据集上进行训练，展现出高自然性和表现力的零样本能力、无缝代码切换能力和速度控制效率。

F5-TTS 音频克隆

最佳开源文生图大模型可图：安装与批量出图的完整教程

在机器测评上，Kolors 获得了最高的 MPS 分数，这与人工评估的结果一致。

可图 kolors

11个顶级的Prompts，用GPT学习的天花板

应用费曼技巧进行深入理解提示：“演示如何将费曼技巧应用于学习和记忆[某主题]的信息，通过简化复杂概念并向他人讲解它们。”

GPT

腾讯的 PhotoMaker - 更快更像更可控的 AI Avatar

我们分别从文本编码器和图像编码器中获取文本嵌入和图像嵌入。

PhotoMaker 文生图

<...87 88 89 909192 93 94 95 96 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1