文章列表-AI魔法学院

文章列表

AI资讯速递 - 快人一步！为你填平AI领域信息差及时揭示AI领域的最新动态

人工智能可以帮我画图吗？

AI资讯 AI新闻

研究人员开源中文文本嵌入模型，填补中文向量文本检索领域的空白

一直以来，基于向量的文本检索是重要的研究议题之一。随着 GPT 的出现，向量检索的意义变得愈发重要。

GPT

借题发挥下最近几例声音克隆的应用案例

最近接连接到几个客户找我订制声音的案例： 1.某父亲痛失爱子，因为儿子托梦告知人是可以复活的，于是这位父亲到处寻找让人复活的办法，于是他关注到了最新的人工智能技术，开始找人咨询和学习技术，通过摸索，他知道通过

声音克隆数字人

企业如何更好的使用大模型？都有哪些框架和方案

ChatGPT的出现将人工智能推向全球关注的中心舞台，大语言模型带动的新一轮人工智能浪潮，正以前所未有的速度席卷全球。

人工智能大模型

快手版Sora「可灵」开放测试：生成超120s视频，更懂物理，复杂运动也能精准建模

它采用了Sora相似的技术路线，结合多项自研技术创新，生成的视频不仅运动幅度大且合理，还能模拟物理世界特性，具备强大的概念组合能力和想象力。

可灵快手文生视频

超越Animate Anyone! 南加大&字节提出MagicPose，不需任何微调就可生成逼真的人类视频

，用于在具有挑战性的人舞视频中进行2D人体动作和面部表情的转移。

MagicPose 视频

一键部署本地私人专属知识库，开源免费！可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型，零代码集成。

2、搭建本地知识库问答系统MarxKB的优势在部署好MarxKB后，你可以添加个人笔记，工作文档，甚至在线网页到知识库里面，然后通过建立索引加上大语言模型对这些知识库的理解实现对文档内容的实时搜索与问答

知识库MaxKB 开源

你是否发现ChatGPT甚至不能按字数要求回复问题？有人做了评测并讨论了可能的原因

有人做了评测并讨论了可能的原因最近在群里和朋友圈看大家都提到让LLM写固定字数的回复时模型几乎都失效了，在网上看到这篇论文的时候就想怎么这么巧就有人针对这个事情发了论文，合着好像就是群友发的。

大模型控制

阿里&字节发表VividTalk，只需单张照片即可根据音频生成栩栩如生的人物说话头像视频

只需提供一张人物的静态照片和一段语音录音，VividTalk即可制作出一个看起来像是实际说话的人物的视频。

VividTalk 视频

目前大语言模型的评测基准有哪些？

ChatbotArena：借鉴游戏排位赛机制，让人类对模型两两评价 ChatbotArena是一个大型语言模型 (LLM) 的基准平台，该项目方LMSYS Org是由加州大学伯克利分校、加州大学圣地亚哥分校和卡内基梅隆大学合作创立的研究组织

人工智能评测大模型

CLiB中文大模型能力评测榜单（持续更新）

病人：哦，真的吗？

大模型人工智能评测

阿里通义实验室薄列峰：从兵马俑跳“科目三”到照片唱歌，四大框架让AI生成的人物活起来丨GenAICon 2024

薄列峰通过人物动作、人物换装、人物替身、人物唱演4个框架来解读人物视频生成新范式。

通义文生视频

Embedding开源模型重磅玩家：北京智源人工智能研究院最新Embedding模型发布！登顶MTEB，免费商用授权！

最近，北京智源人工智能研究院（BAAI）开源了BGE系列Embedding模型，不仅在MTEB排行榜中登顶冠军，还是免费商用授权的大模型，支持中文，应该可以满足相当多人的需要。

开源模型

CMU华人打破大模型黑盒，Llama 2撒谎被一眼看穿！脑电波惨遭曝光，LLM矩阵全破解

随后，他们有了几个惊人的发现。

大模型

语音、视频转文字神器：开源whisper介绍

Whisper是OpenAI的一个项目，旨在通过大规模的弱监督学习来实现语音识别。这种方法使用大量的未标注语音数据和一些已标注的数据来训练一个深度学习模型，从而自动学习如何从语音信号中提取特征并将其转换为文本。Whisper的特点是速度快、准确性高，并且可以处理各种各样的语音信号，包括噪音、口音和语速等。该项目旨在为那些缺乏手动标注数据的语言学家和工程师提供一种新的工具，以帮助他们实现更高效的语音识别。

人工智能大模型 wisper

<...9 10 11 121314 15 16 17 18 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1