文章列表-AI魔法学院

文章列表

PhotoMaker：腾讯最新开源，根据照片生成该人物各种风格图片，项目可落地！

在进行风格化时，生成的面孔如果看起来太真实了，调整风格强度到 30-50，数字越大，ID 忠实度越低，但风格化能力会更好。

PhotoMaker 文生图

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

比如这个在公路上高速奔跑的老虎，不仅画面连贯，随镜头角度的变化合理，老虎四肢的动作协调，而且还把奔跑过程中躯干部分的抖动也展现得淋漓尽致。

可灵快手文生视频

使用ComfyUI玩SDXL的正确打开方式

相比较而言，高级采样器会多一些调整参数，这些参数是我们今天要用到的。

文生图 ComfyUI

一文彻底搞懂多模态 - 多模态推理

· 智能体需要在环境中对自身所处状态进行调整和修复，最终做出对应的动作，以达到目标位置。

多模态推理大模型

实测15款AI大模型实时新闻搜索能力：金融业资讯获取哪家强？

无结果 ✗ ★ 建议调整搜索条件

AI 大模型

神秘模型“小熊猫”一夜刷屏：排名超Flux、Midjourney，网友：一看就中国的

(一张图片，展示了一位金融顾问在现代办公室里与一对年轻夫妇讨论投资策略，强调财务规划和长期财富管理。)

red_panda 文生图

阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio，支持语音增强、分离、目标说话人提取

此外，用户还能通过细调工具对模型进行个性化优化，以满足特定需求。

ClearerVoice-Studio 语音

中本聪的Web3之路

为了让Web3应用能够在不同国家或地区正常运行，并保护用户和投资者的权益，需要与相关部门进行沟通和协调，制定合理和适当的法律规则和标准。

token 比特币加密货币

国内开源的低代码框架有哪些？

Appsmith Appsmith 是一款开源的低代码框架，其主要用于帮助用户及团队更快、更协调地完成构建管理面板、内部工具和仪表板等，且允许拖放UI 组件来构建页面，用户可以通过Appsmith连接到任何

大模型

应用编排的未来是Pipeline，LlamaIndex开发预览版推出Query Pipeline，提升应用开发的灵活性

= p.run_multi({"llm": {"topic": "YC"｝｝) print(output_dict) 同时，为了更好地观察整个流程执行情况，llamaindex的DAG组件均支持回调设计

Query Pipeline 大模型

Stable Diffusion

stable diffusion 远端跑图—— Api基础知识掌握

就已经接通了，是不是很简单~ 有好几个人和我反馈了，controlnet参数不生效，据初步分析是因为大家的controlnet版本更新到了1.1，而我写文章的时候用的是1.0，1.1这个版本api调用不再需要添加

文生图 api

人话聊AI大模型：AIGC如何助力营销的秘密（下）

对于大规模营销活动，或许会采用Copilot半自动模式，结合人工与AI的互动来进行调整，短期内不会完全转向Agent全自动模式。

大模型

MaskGCT：登上GitHub趋势榜榜首的TTS开源大模型

与以往使用k-means方法离散化语义特征相比，这种方法可能导致信息损失，从而影响高质量语音的重建或声学标记的精确预测，尤其是在音调丰富的语言中。

MaskGCT 声音克隆

用ChatGPT快速完成论文全流程

这不仅是重申研究结果的地方，更是强调你的研究对学术界或实践领域带来的贡献和影响。

ChatGPT 写作

7.1k Star！RAGFlow：最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务！

• 多种文本模板可供选择 o 有理有据、最大程度降低幻觉（hallucination） o • 文本切片过程可视化，支持手动调整

OCR RAG 开源

<...68 69 70 717273 74 75 76 77 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1