首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 为你推荐开源项目:Meridian——专属个人情报站!
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 【ComfyUI】爽玩必备,6大插件汇总推荐 !
· 大模型应用的10种架构模式
· 变天了,AI可以一键生成中文海报了......
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 17K star!30秒偷走你的声音,开源声音克隆工具
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
元象首个多模
态
大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
兼顾全局的概览信息和局部的细节信息,能够
识
别
和分析图像中的细微特征,看的更清楚,理解的更准确。
XVERSE-V
多模态大模型
开源
语音、视频转文字神器:开源whisper介绍
OpenAI的Whisper是一种基于深度学习的语音
识
别
模型,它是一种通用的语音
识
别
模型,可以用于语音
识
别
、语音翻译和语言
识
别
等任务。
人工智能
大模型
wisper
耗时7天,终于把15种ControlNet模型搞明白了
,只是
识
别
的东西有多有少 我们这里就用最普通的“openpose”其他的会在后面细讲 点击爆炸按钮 “ ” 就可以在图片右边看到预处理之后的人物
姿
势线条 最后点击生成,小姐姐就摆出我们指定的
姿
势了
文生图
ChatGPT
告
别
抑郁:10个ChatGPT提示词技巧打造你的心理健康顾问,摆脱90%的心理疾病
我将分享一些精心设计的ChatGPT提示词,这些提示词不仅包含了专业知
识
的精华,更指明了具体实践的路径。
心理健康
提示词
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告
别
ElevenLabs,以后就用它了!实测真的很牛
只是
别
被缅北拿去就好。
F5-TTS
音频克隆
RAG
RAG检索增强技术在知
识
库智能检索场景下的应用实践
这个过程类似于对文本内容进行指纹化,使其能够在向量空间中被有效地
识
别
和检索。
知识库
RAG检索增强
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
此外,我们还将语音
识
别
与基于字级时间戳预测(SRWT)的任务结合起来进行训练,这在以前的多任务学习研究中通常被忽视。
大模型
语音
LLM
从零开始用LangChain、Pinecone和LLMs搭建你自己的文档问答系统
在深入实现之前,我们先来了解一下使用语义搜索+GPT问答相比微调GPT的优势: 2.1、更广泛的知
识
覆盖: 语义搜索 + GPT 问答主要包括两个核心步骤,首先从大量的文档中找到相关的段落,然后根据这些段落生成答案
知识库
langchain
AI知
识
库总是不准?教你无脑用GPT整理结构化数据集...
随着LLM的蓬勃发展,企业、个人知
识
库越来越火。
GPT
LLM
4种通过LLM进行文本知
识
图谱的构建方法对比介绍
我们在以前的文章中已经介绍了使用大语言模型将非结构化文本转换为知
识
图谱。
知识图谱
大模型
大模型
测评了8个国产AI大模型,差点崩溃……
从自然语言处理到语音
识
别
,从情感分析到知
识
问答,大模型的应用已经渗透到我们生活的方方面面。
大模型
测评
大模型
姜子牙大模型系列 | 为知
识
检索而生,Ziya-Reader开源,多个长文本中文任务第一
此外,基于大模型进行知
识
库问答、基于大模型的智能客服也是火热的创业项目。
大模型
Ziya
开源
QAnything:网易有道最新开源的“本地化部署知
识
库”AI问答系统
项目简介 "QAnything"是网易有道开发的本地知
识
库问答平台。
网易
RAG
知识库
大模型
链接大模型与外部知
识
,智源开源最强语义向量模型BGE
C-MTEB 的建设参照了同类
别
英文基准 MTEB [12],总共涵盖6大类评测任务(检索、排序、句子相似度、推理、分类、聚类),涉及31个相关数据集。
embedding
语义向量
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
v=VPJe6TyrT-Y 论文阅读 MagicPose:现实的人类
姿
势和面部表情重新定位与身份意
识
扩散 摘要 在这项工作中,我们提出了MagicPose,这是一种基于扩散的模型
MagicPose
视频
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100