文章列表-AI魔法学院

文章列表

AI提示词|一词千金，写提示词的这个技巧你一定没想到！(一）

利用NLP的请求：「请检查这篇文章的语法和清晰度，并提出改进句子结构的建议。」

提示词写作

ChatGPT写论文最强指令！

我希望对我的论文进行润色和编辑，请帮我修改语法、句子结构和流畅性请仔细检查我的论文，以确保语法准确、句子流畅，并改进任何不清晰或非正式的表达。

ChatGPT 指令

腾讯出品！开源AI数字人框架！号称可以不限时长

下面是模型结构示意图下面是并行去噪算法示意图 MuseTalk：实时高质量口型同步模型值得一提的是，MuseV团队最近发布了MuseTalk，这是一个实时高质量的口型同步模型，可以与MuseV

MuseV 视频数字人框架

一个令人惊艳的图片高清化重绘神器：SUPIR来了！

所以这又给我提供了一个新的思路，先通过之前SD WebUI的方法对图片进行高清处理，再通过SUPIR进一步处理，我们仍然能获得一些收益。

SUPIR 文生图

开源免费离线语音识别神器whisper如何安装

本文目的网络上有些教程只展示了whisper使用的效果，没有介绍怎么安装，为避免大家在安装上踩坑，同时也为了避免自己以后万一哪天电脑崩溃需要重装whisper的时候再踩坑，我在这里记录下安装方法。

wisper 翻译免费

Stable Diffusion

Stable Diffusion 加速/优化/升级优化出图速度

关闭模型哈希计算关闭可节省启动时间，但会导致页面内与图片生成数据中无法正常显示模型哈希信息，适用于低速硬盘。

Stable Diffusion 文生图

最强开源大模型Llama 3，在扎克伯格设想中其实是这样的

我从根本上无法经营某件事或经营自己的生活，也无法尝试建造我认为有趣的新事物。

Llama 3 大语言模型

Stable Diffusion

stable diffusion 远端跑图—— Api基础知识掌握

; "sd_model_checkpoint" :"wlop-any.ckpt [7331f3bc87]"}, // 一般用于修改本次的生成图片的stable diffusion 模型，用法需保持一致

文生图 api

比尔盖茨最新预言：AI智能体颠覆计算机交互体验甚至软件行业

但还有很多未满足的需求，许多本来可以从治疗中受益的人却无法获得治疗。

AI智能体

AI“同声传译”新进展！Google发布，无监督，语音识别：Translatotron 3！

无监督的嵌入映射（Unsupervised Embedding Mapping）：这是一种可以把不同语言的语音或文字的内部表示，映射到一个共同的空间的方法。

Translatotron 语音识别

AI赋能实验室：儿童绘本插图

--ar 16:9 --v 6.0 --s 250 --style raw 译文：这是一个充满奇妙想象的儿童插图，描绘了一个充满好奇的[动物]在一个充满活力和魔法的[地点]展开了一段愉快的冒险

插画文生图

Stable Diffusion

Meta发布业界最强文生图模型CM3Leon，实力碾压Stable Diffusion、Midjourney

CM3leon是第一个使用从纯文本语言模型改编的方法进行训练的多模态模型，包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。

文生图

LLM之RAG实战（五）| 高级RAG 01：使用小块检索，小块所属的大块喂给LLM，可以提高RAG性能

在这篇博客文章中，我们将深入研究这两种方法在LlamaIndex中的实现。

RAG 检索

GitHub工程师分享开发Copilot所采用的提示词工程

总的来说，他们建议的方法是基于一系列步骤的。

开源模型

F5-TTS：上海交大开源超逼真声音克隆TTS，告别ElevenLabs，以后就用它了！实测真的很牛

2、流匹配技术： F5-TTS中采用了先进的流匹配技术，这是一种基于最优传输路径的方法，用于改进生成模型的学习过程。

F5-TTS 音频克隆

<...40 41 42 434445 46 47 48 49 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1