文章列表-AI魔法学院

文章列表

Stable Diffusion

万字长篇！超全Stable Diffusion AI绘画参数及原理详解

第一步的噪音最大，然后噪音逐渐减小，并在最后一步降至零。

文生图

AI 换脸——Deepfacelab 下载与安装，新手教程

ensp; 【双击运行批处理文件 ==merged to mp4.bat==】软件会自动读取源视频的配置信息，如帧率、音轨

Deepfacelab 换脸

Prompt及AI提问实践

用户：哦，对了，扬声器有时候会有噪音，而且电池续航时间也比我预期的短很多。

Prompt 大模型提问

比GPT-4快18倍，世界最快大模型Groq登场！每秒500 token破纪录，自研LPU是英伟达GPU 10倍

马斯克Grok，同音不同字前段时间，Groq曾公开基准测试结果后，已经引来了一大波关注。

Groq 大模型

2023年LLM如何入门？请看这篇综述！

实例格式化是指将数据实例（如文本、图像、音频等）处理成一种特定的格式，以便它们可以被用于机器学习算法的输入。

大模型

什么是ChatGPT？

比如还有识别类的（Congnition）：人脸识别，车牌识别这些，还有语音识别，文字识别各种识别任务。

ChatGPT OpenAI 大模型

为什么说数智化可以帮助中小企业降本增效 ?

但现在，愈来愈多的隐私泄露情况，让我们不得不关注到线上娱乐，线上办公所面临的数据安全、用户权益及兼顾便捷性等问题了。

大模型

PHP提示词技巧，全方位精调ChatGPT复杂任务生成效果！！！

冲突：他与忽视民众需求、专注于自身争论的政府官员发生冲突，试图让政府听到民众的声音。

大模型

ComfyUI 基础教程（二）：文生图基础流程

步数：设置我们生成这张图需要去除噪音的次数。

comfyui 文生图

链接大模型与外部知识，智源开源最强语义向量模型BGE

语义向量模型（Embedding Model）被广泛应用于搜索、推荐、数据挖掘等重要领域，将自然形式的数据样本（如语言、代码、图片、音视频）转化为向量（即连续的数字序列），并用向量间的“距离”衡量数据样本之间的

embedding 语义向量

图解大模型训练之：张量模型并行(TP)，Megatron-LM

七、实验效果与GPU利用率八、参考顺便，Megatron，变形金刚反派队伍霸天虎首领，现任环球影城脱口秀演员（啊不是），没有它就凸显不出擎天柱们的战绩，没有它就没有变形金刚电影，我曾经的暑假快乐就要少很多

开源模型

垂直领域大模型的思考

虽然2023年以来几乎很多公司都发出了自己的通用大模型，但是都还停留在“开放闲聊”阶段，这种泛娱乐的方式是不能带来实际生产力的。

垂直领域大模型

2023检索增强生成技术（RAG）研究进展

7.2、多模态扩展 RAG 的技术和概念正在不断进化，它们将如何扩展到图像、音频、视频或代码等其他数据形式？

RAG 检索增强

预训练对话大模型深度解读

，不过创始人为Transformer和LaMDA的作者，估值超过10亿美元，是角色扮演类聊天机器人，主要功能包含：与AI扮演的角色自由聊天通过定义角色描述自由创建角色通过声音、

Fastwhisper + Pyannote 实现 ASR + 说话者识别

Audio from common.error import ErrorCode model_path = config["asr"]["faster-whisper-large-v3"] # 测试音频

faster-whisper 语者识别 ASR

<...27 28 29 303132 33 34 35 36 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1