首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ComfyUI-DDetailer脸部修复
· 什么是BERT?
· Comfyui工作流原理 你都了解吗
· 2万字大模型调研:横向对比文心一言、百川、Minimax、通义千问、讯飞星火、ChatGPT
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 秘塔AI搜索
· ComfyUI进阶前必备插件们续
· 全球六大主流自动PPT制作工具
· 基于 OpenAI Whisper 模型的实时语音转文字工具
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI资讯速递 - 快
人
一步!为你填平AI领域信息差及时揭示AI领域的最新动态
人
工智能可以帮我画图吗?
AI资讯
AI新闻
开源
研究
人
员开源中文文本嵌入模型,填补中文向量文本检索领域的空白
一直以来,基于向量的文本检索是重要的研究议题之一。随着 GPT 的出现,向量检索的意义变得愈发重要。
GPT
借题发挥下最近几例声音克隆的应用案例
最近接连接到几个客户找我订制声音的案例: 1.某父亲痛失爱子,因为儿子托梦告知
人
是可以复活的,于是这位父亲到处寻找让
人
复活的办法,于是他关注到了最新的
人
工智能技术,开始找
人
咨询和学习技术,通过摸索,他知道通过
声音克隆
数字人
大模型
企业如何更好的使用大模型?都有哪些框架和方案
ChatGPT的出现将
人
工智能推向全球关注的中心舞台,大语言模型带动的新一轮
人
工智能浪潮,正以前所未有的速度席卷全球。
人工智能
大模型
Sora
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模
拟
物理世界特性,具备强大的概念组合能力和想象力。
可灵
快手
文生视频
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的
人
类视频
,用于在具有挑战性的
人
舞视频中进行2D
人
体动作和面部表情的转移。
MagicPose
视频
大模型
一键部署本地私
人
专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
2、搭建本地知识库问答系统MarxKB的优势 在部署好MarxKB后,你可以添加个
人
笔记,工作文档,甚至在线网页到知识库里面,然后通过建立索引加上大语言模型对这些知识库的理解实现对文档内容的实时搜索与问答
知识库MaxKB
开源
ChatGPT
你是否发现ChatGPT甚至不能按字数要求回复问题?有
人
做了评测并讨论了可能的原因
有
人
做了评测并讨论了可能的原因 最近在群里和朋友圈看大家都提到让LLM写固定字数的回复时模型几乎都失效了,在网上看到这篇论文的时候就想怎么这么巧就有
人
针对这个事情发了论文,合着好像就是群友发的。
大模型
控制
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音频生成栩栩如生的
人
物说话头像视频
只需提供一张
人
物的静态照片和一段语音录音,VividTalk即可制作出一个看起来像是实际说话的
人
物的视频。
VividTalk
视频
目前大语言模型的评测基准有哪些?
ChatbotArena:借鉴游戏排位赛机制,让
人
类对模型两两评价 ChatbotArena是一个大型语言模型 (LLM) 的基准平台,该项目方LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织
人工智能评测
大模型
大模型
CLiB中文大模型能力评测榜单(持续更新)
病
人
:哦,真的吗?
大模型
人工智能评测
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的
人
物活起来丨GenAICon 2024
薄列峰通过
人
物动作、
人
物换装、
人
物替身、
人
物唱演4个框架来解读
人
物视频生成新范式。
通义
文生视频
开源
Embedding开源模型重磅玩家:北京智源
人
工智能研究院最新Embedding模型发布!登顶MTEB,免费商用授权!
最近,北京智源
人
工智能研究院(BAAI)开源了BGE系列Embedding模型,不仅在MTEB排行榜中登顶冠军,还是免费商用授权的大模型,支持中文,应该可以满足相当多
人
的需要。
开源模型
大模型
CMU华
人
打破大模型黑盒,Llama 2撒谎被一眼看穿!脑电波惨遭曝光,LLM矩阵全破解
随后,他们有了几个惊
人
的发现。
大模型
开源
语音、视频转文字神器:开源whisper介绍
Whisper是OpenAI的一个项目,旨在通过大规模的弱监督学习来实现语音识别。这种方法使用大量的未标注语音数据和一些已标注的数据来训练一个深度学习模型,从而自动学习如何从语音信号中提取特征并将其转换为文本。Whisper的特点是速度快、准确性高,并且可以处理各种各样的语音信号,包括噪音、口音和语速等。该项目旨在为那些缺乏手动标注数据的语言学家和工程师提供一种新的工具,以帮助他们实现更高效的语音识别。
人工智能
大模型
wisper
<
...
9
10
11
12
13
14
15
16
17
18
...
>
1
2
4
5
6
7
8
9
100