首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 10大Midjourney描述词网站,让你Ai创作随心所欲!
· 好看的图片不知道怎么写提示词?用AI读出来
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 用AI为古诗词生成插画
· ComfyUI学习笔记:插件安装
· 图片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
· WeChaty:强大的微信个人号机器人SDK
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 火山写作:一款助力写作能力提升的AI助手
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语
义检索系统[全]:基于Milvus+ERNIE+SimCSE+In-batch Negatives样本策略的学术文献
语
义检索
;论中西方文化差异在非
言
语
交际中的体现中西方文化,差异,非
言
语
交际 0.4644506871700287 中西方
语
言
与文化的差异 中西方体态
语
文化差异跨文化,体态
语
,非
语
言
交际
开源模型
ChatGPT
让ChatGPT帮我写SQL
推荐一个Github上Start超过3.4K,可将自然
语
言
转化为SQL
语
句的开源项目。
SQL
教程
郭德纲讲英
语
相声详细教程
选择你希望进行翻译的
语
言
Heygen目前支持18种输入
语
言
和15种输出
语
言
。
数字人
音视频
阿里
[论文] 阿里提出AgentScope:灵活强大的智能体框架
大型
语
言
模型(LLMs)的快速发展是的多智能体(Multi-Agent)应用取得了显著进展。
AgentScope
语言大模型
智能体
阿里
阿里RAG新框架R4:增强检索器-重排序-响应器,5个知识密集任务上都超过Self-RAG等!
大型
语
言
模型(LLMs)在生成文本时可能会产生错误信息,即“幻觉”问题。
RAG
检索
大型语言模型
语
音克隆又又又又又升级了
,时隔几个月Meta又推出了最新的
语
音生成技术,不仅能可能声音,还能通过对声音的描述来生成独特的音色,同时还能通过描述来生成各种各样的音效,甚至能通过文字描述来编辑声音,整体来说,这项技术几乎囊括了现在人们对
语
音生成技术的所有的需求
Meta
语音生成
开源
语
音、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的
语
音识别模型,它是一种通用的
语
音识别模型,可以用于
语
音识别、
语
音翻译和
语
言
识别等任务。
人工智能
大模型
wisper
开源
【开源项目】Flow Matching
语
音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入
语
音合成领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
Insanely Fast Whisper:超快的Whisper
语
音识别脚本
项目简介 这篇内容介绍了OpenAI的Whisper Large v2
语
音转录模型的超快速能力。
音频
Whisper
OpenAI
OpenAI大动作:Whisper large-v3重塑
语
音识别技术
这款最新的自动
语
音识别模型不仅在多
语
言
识别方面取得了显著进步,而且还将很快在OpenAI的API中得到支持。
Whisper
语音识别
ChatGPT
Prompt全攻略(一):ChatGPT时代,什么是Prompt?
简单来说,它是一个可以与用户用自然
语
言
进行交流的AI系统。
prompt
开源
网易(TTS)EmotiVoice:开源
语
音合成,支持2000多音色
你是否曾经想过,如果你能用不同的情感和
语
气来表达你的想法,那该多有趣?
EmotiVoice
语音合成
关于AI声音生成的一切(
语
音+音乐+嘴型)
; 文字转声音+声音克隆 •clone-voice(解压就能用):这是一个基于Web界面的声音克隆工具,可以将文字或声音转换为特定音色的音频,支持多种
语
言
声音
RAG
高级 RAG 技术——图解概览
(大
语
言
模型)生成的回答提供依据。
RAG
检索
图解
心理
Asimov的预
言
与《Reflexion》的Prompt启示:机器人心理学家的新纪元
大型
语
言
模型(LLMs)越来越多地被用于与外部环境(如游戏、编译器、APIs)互动作为目标驱动的代理。
大模型
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100