文章列表-AI魔法学院

文章列表

保姆级教程：手把手教你创建GPTs角色应用

GPTs技术的出现，为个人开发者提供了快速创造多样小型产品的可能性，这在以往通常需要程序员、产品经理和设计师的协作才能实现。

GPTs 教程

腾讯出品！开源AI数字人框架！号称可以不限时长

，时长00:09 ，时长00:39 技术亮点无限视频长度：MuseV采用了视觉条件并行去噪方案，支持生成理论上无限长度的视频

MuseV 视频数字人框架

ChatGPT提示工程5篇合集 - 吴恩达和OpenAI出品

ChatGPT提示工程 - 总结 3.文本推理可以让模型来识别一段内容的情绪，或者抽取指定的内容。

ChatGPT prompt

WSL2安装（详细过程）

使用自己的GNU/Linux发行包管理器安装其他软件。

虚拟化 docker

AI“同声传译”新进展！Google发布，无监督，语音识别：Translatotron 3！

它的原理是，把输入的语音信号随机地掩盖一些部分，然后让模型尝试重建完整的语音信号。

Translatotron 语音识别

TrOCR——基于transformer模型的OCR手写文字识别

来进行计算机视觉方面的任务，比如对象检测，对象分类，对象分割等，这里毕竟著名的模型VIT，Swin便是成功的把transformer的注意力机制应用到了计算机视觉任务，那么基于transformer模型的OCR识别任务，便是理所当然的了

OCR 手写文字识别

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

这个框架利用了 Stable Difusion 模型的文生图功能并结合人像风格化 LORA 模型训练及人脸相关感知理解模型，将输入的图片进行训练后推理输出生成为个人写真图像。

阿里云视频音频

如何下载及使用通义千问7B开源大模型

modelscope.cn/studios/qwen/Qwen-7B-Chat-Demo/summary 欢迎小伙伴们来创空间体验Qwen-7B-Chat的模型效果👏～模型推理

通义千问

模拟ChatGPT流式数据——SSE最佳实践（附可运行案例）

为什么要这样传输，从使用场景上来说，ChatGPT 是一个基于深度学习的大型语言模型，处理自然语言需要大量的计算资源和时间，响应速度肯定比普通的读数据库要慢接口等待时间过长，显然不合适。

GPT

手把手教你本地部署清华大学KEG的ChatGLM-6B模型——Windows+6GB显卡版本和CPU版本的本地部署

HuggingFace的transformers库，尽管官方说：使用 pip 安装依赖：pip install -r requirements.txt，其中 transformers 库版本推荐为 4.27.1，但理论上不低于

提示词 prompt chatgpt

【开源项目】Flow Matching 语音合成

https://github.com/shivammehta25/Matcha-TTS 工程展示： https://shivammehta25.github.io/Matcha-TTS/ 在线推理：

音视频 Flow Matching

ChatGPT等大模型实用的提问技巧

用 {###} or {"""} 包裹住输入信息，用这种方法来和其他信息分割，避免 AI 理解错误输出要求 Output Indicator 指定输出的类型或格式

大模型

新测试基准发布，最强开源Llama 3尴尬了

§ 复杂性：提示词是否有多层推理、组成部分或变量？

Llama 3 大模型开源

国内开源的低代码框架有哪些？

Appsmith Appsmith 是一款开源的低代码框架，其主要用于帮助用户及团队更快、更协调地完成构建管理面板、内部工具和仪表板等，且允许拖放UI 组件来构建页面，用户可以通过Appsmith连接到任何

大模型

有道开源的国产语音库EmotiVoice爆火了！具有情绪控制功能的语音合成引擎！

输入推理文本格式：说话人|情感样式内容|音素|说话内容我们可以运行下面这个代码，自动生成推理文本音素（phonemes） python frontend.py data/my_text.txt

EmotiVoice 语音库

<...80 81 82 838485 86 87 88 89 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1