首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· stable diffusion API 调用,超级详细代码示例和说明
· 使用ComfyUI玩SDXL的正确打开方式
· ComfyUI的特性以及安装流程
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
手把手教你认识学会LangChain
数据增强的
生
成,数据增强
生
成涉及特定类型的链,它首先与外部数据源交互以获取数据用于
生
成步骤。
langchain
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
该框架包括用于常见工作流程的插件,例如语音活动检测和语音转
文
本。
voice
agent
开源
音视频
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
下
图
是Sora跟其他模型在
生
成视频能力上的一些对比: 在OpenAI发布Sora之前,业界基于大模型
生
成视频的主要平台有Pika、Runway、Moonvalley等,但是这些平台视频
生
成默认都是几秒中
视频生成
sora
提示词
九个让你成为GPT提示高手的提示词框架
• 目的:讨论意
图
或目标。
GPT
开源
只需四步就能构建自己的Agent!达摩院新开源框架小白也能用
写一篇关于Vision Pro VR眼镜的20字宣传
文
案,并用女声读出来,同时
生
成个视频看看。
大模型
工具
3.5k star!一款万能的 SQL 分析工具,厉害了!
而现实
生
活中,我们经常会遇到各种各样的本地
文
件,比如Excel、JSON、CSV等。
dsq
开源项目
SQL
RAG
Rerank——RAG中百尺竿头更进一步的神器,从原理到解决方案
检索增强
生
成(RAG)是解决大语言模型(LLM)实际使用中的一套完整的技术,它可以有效解决LLM的三个主要问题:数据时效性、幻觉和数据安全问题(在我之前的
文
章《大模型主流应用RAG的介绍
RAG
检索增强
企业
【上篇】深度解析AI大语言模型(LLM)在企业应用的关键技术与典型架构
随着大模型的不断迭代与升级,周边
生
态的培育与成熟,其在B端企业级场景的落地应用也逐渐拉开序幕。
大语言模型
大模型
MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
在推理过程中,模型以并行方式
生
成指定长度的标记。
MaskGCT
声音克隆
GPTs
如何快速构建GPTs个人知识库应用?
GPTs 是一个创新方式,允许任何人根据自己的日常需求、特定任务、工作或家庭
生
活,定制个性化的 ChatGPT,并且可以将这些定制版本分享给他人。
GPTs
知识库
大模型
全量免费的EMO模型上架通义APP,外媒称之为Sora之后最受期待的大模型之一
两个月前,阿里巴巴通义实验室公开了一篇能够让照片唱歌说话的
生
成式AI模型论
文
,EMO(Emote Portrait Alive),在海外媒体和社交平台引起热烈反响,被一批科技圈大V轮番转发。
EMO
阿里
全民演唱
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
像拍的,不像
生
成的,实话。
sora
视频生成
开源
【开源项目】Flow Matching 语音合成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合成领域,下面是voicebox的一个工作流程
图
Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
开源
从声纹模型到语音合成:音频处理 AI 技术前沿 | 开源专题 No.45
facebookresearch/audiocraft[1] Stars: 16.6k License: MIT AudioCraft 是一个用于音频
生
成的
AudioCraft
音频
阿里
阿里出品自动化视频剪辑工具FunClip!
FunClip让用户能够根据识别结果,轻松选择
文
本片段或特定说话人,从而快速裁剪出所需视频片段。
FunClip
视频
阿里
<
...
44
45
46
47
48
49
50
51
52
53
...
>
1
2
4
5
6
7
8
9
100