文章列表-AI魔法学院

文章列表

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

VGen 可以根据用户输入的静态图像和文本生成目标接近、语义相同的视频，生成的视频具高清(1280 * 720)、宽屏(16:9)、时序连贯、质感好等特点。

阿里云视频音频

用so-vits-svc-4.1进行音色转换的极简教程！

主要是因为孙燕姿的音色独特，吐词清晰，网络上存在她的大量歌曲，非常便于训练。

so-vits-svc 音色转换教程

AI写作：一步到位，如何用 AI 生成整篇文章？做自媒体必看！

比如之前提到过的3W1H：想用AI创作出高质量文案？

结构化提示词写作

Suno音乐新手指南（手把手完整版教程）

v2阶段，Suno生成的歌曲，经常出现开头几个字不清楚或者唱错唱漏的情况。

suno 歌曲教程

快手大模型出炉！【快意】来袭！

具体对比结果如下所示： · C-Eval是一个全面的中文基础模型评测数据集，由清华大学、上海交通大学和爱丁堡大学合作构建，包含12342道单项选择题，涵盖数学、物理、化学、生物、历史、政治、

开源模型

谈Agent构建平台的设计

（当然不少情况是不是真的搞清楚了需求我是存疑的，不过这偏离了本文主题，就再讨论了）这并非UI不够好看、或者产品的非LLM部分速度不够快、或者产品的服务经常无法访问之类的问题，就是最直接的是否有满足用户需求的问题

Agent 构建

AI备案实战指引

很多AI创业公司对AI算法备案不了解，甚至有人还搞不清楚做AI应用产品是否需要做算法备案，本文希望给大家一个解读。

备案

耗时7天，终于把15种ControlNet模型搞明白了

但目前现状是：随机性太强很多时候能不能出来一个好看的画面，只能通过大量的「抽卡」实现，以数量去对冲概率这种情况下，如果能用好控制出图的三个最关键因素，能让「出图与我们想象的画面一致」概率更高

文生图

金融行业的AIGC应用

东证金工的《ChatGPT 在量化投资中的运用：股票预测》研究了通过ChatGPT建立模型和生成源码，最终建立了LSTM股价预测模型；国金证券金融工程团队在2023年4月发布的研报《如何利用ChatGPT挖掘高频选股因子

金融大模型

Stable Diffusion

Stable Diffusion ControlNet：Reference“垫图”功能，不炼丹也能保持同一人物

Style Fidelity(仅用于均衡模式)：风格保真度， 3、来个可爱的猫咪案例演示：在网上找一张背景干净，主体清晰的图片，这里找的一个猫，将图片改为512x512px尺寸

文生图

RAG从入门到精通-RAG简介

可解释性强，RAG可以通过提示工程等技术，使得LLM生成的答案具有更强的可解释性，从而提高了用户对于答案的信任度和满意度。

rag 大模型

最详细的文本分块(Chunking)方法——可以直接影响基于LLM应用效果

的复杂性 RAG涉及的内容其实广泛，包括Embedding、分词分块、检索召回（相似度匹配）、chat系统、ReAct和Prompt优化等，最后还有与LLM的交互，整个过程技术复杂度很高。

RAG 大模型

8个常用中文OCR数据集，附下载链接

图像的分辨率较高，介于1294*864和1920*1280之间。

OCR

CodeGeeX：Tab一下，代码自动生成

我们对数据进行了去重和清洗，整个代码语料含有23种编程语言、总计1587亿个标识符（不含填充符）。

大模型

Roop参数说明，ROOP->StyleGAN演示！

因为roop的核心模型只有128像素，所以如果你的视频很大，不管你给的素材有多么高清，合成之后都是模糊的。

视频 StyleGAN

<...39 40 41 424344 45 46 47 48 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1