文章列表-AI魔法学院

文章列表

语义检索系统[全]：基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献语义检索

;论中西方文化差异在非言语交际中的体现中西方文化,差异,非言语交际 0.4644506871700287 中西方语言与文化的差异中西方体态语文化差异跨文化,体态语,非语言交际

开源模型

让ChatGPT帮我写SQL

推荐一个Github上Start超过3.4K，可将自然语言转化为SQL语句的开源项目。

SQL

郭德纲讲英语相声详细教程

选择你希望进行翻译的语言 Heygen目前支持18种输入语言和15种输出语言。

数字人音视频

[论文] 阿里提出AgentScope：灵活强大的智能体框架

大型语言模型（LLMs）的快速发展是的多智能体（Multi-Agent）应用取得了显著进展。

AgentScope 语言大模型智能体

阿里RAG新框架R4：增强检索器-重排序-响应器，5个知识密集任务上都超过Self-RAG等！

大型语言模型（LLMs）在生成文本时可能会产生错误信息，即“幻觉”问题。

RAG 检索大型语言模型

语音克隆又又又又又升级了

，时隔几个月Meta又推出了最新的语音生成技术，不仅能可能声音，还能通过对声音的描述来生成独特的音色，同时还能通过描述来生成各种各样的音效，甚至能通过文字描述来编辑声音，整体来说，这项技术几乎囊括了现在人们对语音生成技术的所有的需求

Meta 语音生成

语音、视频转文字神器：开源whisper介绍

OpenAI的Whisper是一种基于深度学习的语音识别模型，它是一种通用的语音识别模型，可以用于语音识别、语音翻译和语言识别等任务。

人工智能大模型 wisper

【开源项目】Flow Matching 语音合成

CFM是一种新技术，已被证明可以改进扩散模型，Meta的Voicebox模型将CFM引入语音合成领域，下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional

音视频 Flow Matching

Insanely Fast Whisper：超快的Whisper语音识别脚本

项目简介这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。

音频 Whisper

OpenAI大动作：Whisper large-v3重塑语音识别技术

这款最新的自动语音识别模型不仅在多语言识别方面取得了显著进步，而且还将很快在OpenAI的API中得到支持。

Whisper 语音识别

Prompt全攻略(一):ChatGPT时代,什么是Prompt?

简单来说,它是一个可以与用户用自然语言进行交流的AI系统。

prompt

网易（TTS）EmotiVoice：开源语音合成，支持2000多音色

你是否曾经想过，如果你能用不同的情感和语气来表达你的想法，那该多有趣？

EmotiVoice 语音合成

关于AI声音生成的一切（语音+音乐+嘴型）

; 文字转声音+声音克隆 •clone-voice（解压就能用）：这是一个基于Web界面的声音克隆工具，可以将文字或声音转换为特定音色的音频，支持多种语言

声音

高级 RAG 技术——图解概览

（大语言模型）生成的回答提供依据。

RAG 检索图解

Asimov的预言与《Reflexion》的Prompt启示：机器人心理学家的新纪元

大型语言模型（LLMs）越来越多地被用于与外部环境（如游戏、编译器、APIs）互动作为目标驱动的代理。

大模型

<...4 5 6 789 10 11 12 13 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1