文章列表-AI魔法学院

文章列表

十篇高质量的AI-Agents相关论文，让AI教你认识AI-Agents

Andrej Karpathy和Lilian Weng开始对外界释放出一个信号，基于 LLM的AI Agents是AGI领域接下来重要的发展方向，使得很多原本嘲笑Auto-GPT开发者，开始更多开始正视基于

开源模型

Stable Diffusion

Stable diffusion三步搞定——场景定制化

在日常的工作中，为了保证视觉构图还有画面风格的一致性，有意的去搭建了属于赶集行业特征的运营场景素材库，目的是为了让设计师能灵活调用，随做随取，节省时间提高效率。

AI图片

什么是极限、导数、微分与积分（通俗易懂）！

你的目光时而注视前方的道路，时而瞥向仪表盘上跳动的速度指针。

极限导数微分积分

一文搞定 ComfyUI SDXL1.0 完整流程

如果要在一篇文章里面介绍完整的使用方法实在太麻烦了，这里我推荐几个 B站大神的视频。

文生图 comfyui

Stable Diffusion

Stable Diffusion 常用插件推荐

sd-webui-IS-NET-pro https://github.com/ClockZinc/sd-webui-IS-NET-pro 将视频转换为无数张图片

Stable Diffusion 插件

体验了几款AI工具&&最新出现的跟数字人相关的几款大模型

文生视频 pixverse.ai https://pixverse.ai/7h8PTrxB5S 加入Discord，输入相应的参数，type '/' first, and then

数字人大模型文生图

SDXL模型lora训练参数详细设置，显存占用22G，不用修脸原图直出

还没装的，去秋叶大佬视频详情里找一下哈~ https://www.bilibili.com/video/BV1AL411q7Ub/?

SDXL 训练

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

03 效果展示 MaskGCT 能超自然地模拟参考音频音色与风格，并跨语言生成音频：与基于自回归的TTS系统相比，MaskGCT具有更强的稳定性，绕口令也不在话下

MaskGCT 声音克隆

前半年，我看到的有趣的 AI 产品

它们不持久原因主要还是需求点本身低频或非刚需，噱头价值衰减。

AI工具

中国首份AIGC监管文件正式实施——《生成式人工智能服务管理暂行办法》简析

亮点： 1· 作为中国首份生成式人工智能（“AIGC”）监管文件，管理办法体现了现阶段监管机构的态度，即“既要重视发展，也要重视风险”。

人工智能

【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能！效果炸裂！手把手带你理论+实战部署推理!

包含两个核心模型：SenseVoice 负责语音识别和音频处理，CosyVoice 负责语音生成和控制。

asr tts 声音

微信向量检索分析一体化数仓探索：OLAP For Embedding

在大模型出现之前，向量检索已经成熟并广泛应用在“推荐”、“文本/视频搜索”等领域了：向量数据库介绍： ChatGPT 掀起的大模型浪潮，embedding 在其中的核心地位，使得向量化数据库又成为时代新宠

OLAP For Embedding 一体化数仓

【AI绘图工具】太爆炸了，AI出图速度100fps（每秒100张图片），比LCM、SDXL Turbo更快，目前No.1

colab.research.google.com/github/hewis123/stream-d/blob/main/Untitled2.ipynb 今天我就来介绍一下这个产品工具吧，我都不知道该把它归类入视频工具还是图像工具

StreamDiffusion 文生图

【AI绘画】入门英文名词解析

只能在线联网调用接口提交数据获得返回结果并不知道是怎么来的会有很多限制为了避免法律风险 AI绘画项目对于某些人名或者不可描述画面作了限制不允许生成此外对于调用频次

文生图 AI绘画

阿里云开源通义千问多模态大模型Qwen-VL，持续推动中国大模型生态建设

8月25日消息，阿里云推出大规模视觉语言模型Qwen-VL，一步到位、直接开源。

大模型

<...13 14 15 161718 19 20 21 22 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1