文章列表-AI魔法学院

文章列表

【工具书】基于角色和思维链的人工智能中文Prompt提示词，涵盖几乎所有场景

扮演技术撰稿人扮演技术作家。

prompt 提示词

【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声！！

音色一:男音色-铿锵有力效果展示这是我经过挑选后男音对应的数据供768维。

chattts tts 文生语音

一文探秘LLM应用开发-Prompt(相关概念)

本文旨在让无大模型开发背景的工程师或者技术爱好者无痛理解大语言模型应用开发的理论和主流工具，因此会先从与LLM应用开发相关的基础概念谈起，并不刻意追求极致的严谨和完备，而是从直觉和本质入手，结合笔者调研整理及消化理解

prompt 大模型

Stable Diffusion

stable diffusion如何确保每张图的面部一致？

，我们只要记住四个字就行了：图像提示，如果还觉得长，那就两个字：垫图。

图生图文生图 sd

AI绘画Stable-Diffusion风格化实战

这些有趣的风格化效果其实都是图像风格化技术的应用成果。

Stable-Diffusion 文生图

Insanely Fast Whisper：超快的Whisper语音识别脚本

通过使用Transformers和Optimum技术，可以在不到10分钟内转录300分钟（5小时）的音频。

音频 Whisper

pdf2htmlEX：效果相当好的一个PDF转HTML程序，和原始PDF几乎一模一样。

其背后是利用的Chrome Headless，让Chrome渲染PDF，再导出成HTML，甚至图片都转成了 base64 字符，所以一个网页就可以包含完整的文本、字体和图片等内容这是我的

PDF转换

研究人员开源中文文本嵌入模型，填补中文向量文本检索领域的空白

值得关注的是，目前，M3E 模型中使用的数据集、训练脚本、训练好的模型、评测数据集以及评测脚本都已开源，用户可以自由地访问和使用相关资源。

GPT

马斯克怒告OpenAI案解密：Ilya看到了什么？125万亿参数Q*细节曝光，53页PDF全网疯转

虽然在大多数人看来，这并不是什么令人印象深刻的事，但这的确是朝向AGI迈出的一大步，堪称重要的技术里程碑。

OpenAI 大模型

世界上最流行（github排名高）的开源移动机器人的操作系统ROS开源了！！

此外，TurtleBot3还支持语音识别和语音合成技术，可以与人进行自然语言交互，完成特定任务。

ROS 机器人开源模型

OCR是什么以及推荐几款开源中文OCR识别软件

二值化：　　如今数码摄像头拍摄的图片大多是彩色图像，彩色图像所含信息量巨大，不适用于OCR技术。

OCR

几款开源的OCR识别项目，收藏备用

goncalopp/simple-ocr-opencv.git OCR工具 OCRmyPDF OCRmyPDF是基于tesseract-ocr开发、训练的文字识别提取的开源项目

OCR

StableDiffusion

AI绘画由入门到精通：StableDiffusion精讲课程

随着人工智能技术的发展，Stable Diffusion作为一款强大的文生图软件已经引发了全球范围内的创作革命。

SD 视频课程 AI绘画

从⼤模型到 AI 应⽤落地，工程实现有多复杂?

众所周知，⼤模型代表了⼈⼯智能技术的前沿发展。

大模型

微软对 Sora 进行了逆向工程分析，揭秘 Sora 的秘密

文章首先回顾了 Sora 的开发历程，探索了支撑这一“数字世界构建者”的关键技术。

Sora 微软

<...32 33 34 353637 38 39 40 41 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1