文章列表-AI魔法学院

文章列表

SD出图新思路

（糊点没关系）第二步： ①打开图生图，将模糊的截图丢进去 ②顺便把之前文生图的关键词也粘过来第三步：采样器和尺寸跟之前的调整一致，重绘幅度可以根据情况调整。

文生图 SD

AI产生意识，对人类意味着什么

意识水平取决于一个系统内部信息的整合程度。

AI 意识

阿里推理模型来了！Marco-o1 发布即开源

MCTS解决方案扩展：通过将大语言模型与蒙特卡罗树搜索（MCTS）相结合，利用模型输出的置信度来指导搜索，大大扩展了解决方案空间。

Marco-o1 推理模型

Stable Diffusion

Stable Diffusion｜提示词高阶用法（二）双人同图

生成模式：Generation modeAttention 模式和 Latent 是两种不同的生成模式，作者并不是深度学习的从业者，对底层原理并不是很了解。

文生图

网易（TTS）EmotiVoice：开源语音合成，支持2000多音色

EmotiVoice的最突出的特点是，它可以根据你的提示来调整语音的情感、语气、风格、速度、音高等参数，让你的语音更加生动和个性化。

EmotiVoice 语音合成

AI高手都在用的10个提示词prompt网站，建议收藏！

二、GPT提示词网站推荐 1 https://flowgpt.com Flowgpt拥有非常丰富的提示词，比如小红书种草文案

AI绘画 | Midjourney高质量肖像提示词的写法（附50+肖像提示词prompt）

一、逼真肖像提示词的注意事项 1.确保使用 -v 5 以上模型大家都知道Midjourney的模型从V2-V5，生成的图像质量也越来越高，目前最新版本是V5.2,真正在逼真度上有质的飞跃的是从V5

文生图

从声纹模型到语音合成：音频处理 AI 技术前沿 | 开源专题 No.45

· EnCodec：一种高保真度神经音频编解码器。

AudioCraft 音频

M3E 可能是最强大的开源中文嵌入模型

若用神经网络把输入映射到更低维度的空间，实质强调的就是映射而已。

开源模型

向量数据库不是一个单独的数据库分类

直到2023年第二季度之前，“向量搜索”还主要存在于数据库初创公司，如Pinecone、Milvus、Weaviate等。

大模型向量数据库

Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)

transformers库基于Transformer模型架构，这是一种用于处理序列数据的深度学习模型。

Whisper 语音优化

clone-voice：一键克隆声音，开源AI技术让声音创作更便捷、更个性化

二、技术原理剖析 clone-voice的核心技术基于深度学习模型，特别是WaveNet和Tacotron系列模型，这些模型在语音合成领域有着出色的表现.

clone-voice 声音克隆

Stable Diffusion

Stable Diffusion ControlNet：Reference“垫图”功能，不炼丹也能保持同一人物

控制权重：控制模型对生成图片的影响的程度。

文生图

清华、面壁智能发布：主动式Agent 2.0

评估指标：使用奖励模型对预测任务进行二元分类，并与人类标注结果进行比较，计算召回率、精确度、准确度和F1-Score

Agent 2.0 大模型

论文润色 | GPT4.0论文润色指令总结（含GPT3.5和4.0润色效果对比）

打磨文字以符合学术风格，提高拼写、语法、清晰度、简洁性和整体可读性。

论文提示词写作

<...79 80 81 828384 85 86 87 88 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1