首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· Stable Diffusion 30种采样器全解
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· Fastwhisper + Pyannote 实现 ASR + 说话者识别
· 挑战真实影像!Stable Diffusion超越摄影师的光影模型
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 如何最简单、通俗地理解Transformer?
· [Stable Diffusion]SD安装、常用模型(checkpoint、embedding、LORA)、提示词具、常用插件
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
微软最强全自动数据可视化工具!现已开源
会生成全部变量的摘要,包括变量的行数、最小值、最
大
值、标准差。
大模型
如何用
大
语言模型构建一个知识问答系统
从
大
语言模型(Large Language Model, LLM)[2]角度而言,上面的需求是在两阶段训练模式下,面向下游场景进行适配的问题。
知识库
开源
Dify:
大
模型创业开源工具,46,558 行代码,完全开源
工作流: 在画布上构建和测试功能强
大
的
AI
工作流程,利用以下所有功能以及更多功能。
Dify
开源工具
EverydayWechat:让微信变得更强
大
,引领每日生活新体验
一、简介 EverydayWechat是一个强
大
的Python库,旨在为微信用户提供更多便利和功能扩展。
EverydayWechat
开源
中文对话
大
模型BELLE全面开源!(附:数据+模型+轻量化)
在中文对话
大
模型开源社区里,最近迎来了一位优秀的新成员——BELLE。
belle
训练
大模型
深入浅出:
大
语言模型中必不可少的技术——Embedding简介
Embedding在
大
模型中的价值 如何基于Embedding让
大
模型解决长文本(如PDF)的输入问题?
embedding
OpenAI
来自OpenAI应用研究主管关于Agent的万字长文-
AI
Agents介绍
另一方面,Andrej Karpathy认为普通人、创业者和极客在构建
AI
Agents方面相比OpenAI这样的公司更有优势,
大
家目前处于平等竞争的状态,因此他很期待看到这方面的成果。
Agent
数字人
一款构建
AI
数字人项目开源了!自动实现音视频同步!
1、Video-Tetalking Video-ReTalking 是一个利用
AI
实现视频人物嘴型与输入的声音同步的创新技术。
AI数字人
音视频同步
开源
DeepSeek V3刷屏,550万元2000张卡做出的开源模型,和OpenAI几亿烧出来的一样好
而不久前,Anthropic的CEO达里奥·阿莫迪曾透露,GPT-4o这样的模型训练成本约为1亿美元,而目前正在开发的
AI
大
模型训练成本可能高达10亿美元。
DeepSeek
V3
开源模型
开源
【语音领域-又双叒更新】阿里开源FunAudioLLM: 2
大
核心模型、5
大
亮点功能!效果炸裂!手把手带你理论+实战部署推理!
2407.04051 理论篇: FunAudioLLM项目介绍 FunAudioLLM整体系统框架介绍 FunAudioLLM 是阿里语音团队最新开源的项目,用于改善人类与
大
型语言模型的自然语音交互
asr
tts
声音
微调
大
模型微调数据选择和构造技巧
大
模型场景微调里面,最关键地的一个是问题是: 选择什么样的数据微调?
大模型
微调
整理了近期所有TTS相关的
大
模型
从 XTTS 到 Pheme,从OpenVoice 到 VITS,每个
大
模型包括源码地址,支持的语言,非常棒!
TTS
大模型
Google
AI
“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
语音识别(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音识别技术还面临着一些挑战,其中最
大
的一个就是如何支持更多的语言。
Translatotron
语音识别
开源
通过声音生成逼真的全身形象?!Meta开源
AI
工具:audio2photoreal
它使用了一种叫做变分自编码器的方法,可以从
大
量的人体数据中学习出一个低维的表示空间,然后用这个空间来生成多样的身体姿态。
audio2photoreal
开源工具
数字人
腾讯出品!开源
AI
数字人框架!号称可以不限时长
腾讯推出开源
AI
框架:AniPortrait 2、开源、可本地部署的
AI
知识问答库来了!
MuseV
视频
数字人
框架
<
...
29
30
31
32
33
34
35
36
37
38
...
>
1
2
4
5
6
7
8
9
100