首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· Fooocus制作从小到老图
· AI写作:如何用AI一键提炼文章要点,10倍提效(含提示词)
· MCP服务介绍及应用场景报告-来自Manus
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
· 大模型量化:什么是模型量化,如何进行模型量化
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
十大开源语音识别项目
总而言之,趋动云在提供强大计算资源和全面支持的同时,通过其安全可靠的多样化软
件
配置和强大的GPU计算资源,为研究者提供了一个安心、高效的研究环境。
语音识别
开源项目
开源
微软最强全自动数据可视化工具!现已开源
上传文
件
。
大模型
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
图3:多语言检索效果 b) 通过消融实验对比,可以发现在使用不同相似度计算方式条
件
下,M3-Embedding中的蒸馏损失都能给最终效果带来明显提升,尤其是对于稀疏检索而言
BGE
M3-Embedding
多语音检索
工具
TTS,一个奇妙的AI工具
当我们制作视频的时候,就会发现,给视频配音真是一
件
非常专业的事,对于非专业人士,费工费力后,完成的配音效果往往并不理想。
TTS
文本转语音
ChatGPT
15种ChatGPT高频用法
编程和技术支持可以解决具体的编程问题,理解某个编程概念,使用某个软
件
或技术时遇到困难也可以寻求ChatGPT帮助 3.
大模型
效率
视频
Stability AI推出视频生成模型Stable Video Diffusion
然而,需要注意的是,该模型目前处于“研究预览”阶段,使用者必须同意特定的使用条款,明确规定了其预期应用领域,如“教育或创意工具”等,同时禁止用于“真实事
件
或人物的表现”。
Video
视频创作
SD
语音
语音克隆又又又又又升级了
目前还不支持中文,所以只能解决翻译软
件
朗读的结果如下: 然后是替换声音风格: 原始音频是系统提供的Alice,然后我们替换成 一位中年男子在说话,声音轻松而亲切。
Meta
语音生成
大模型
视频大模型训练相关词条解释
我把跟Sora以及文生视频模型训练相关的词条放到附
件
中,相信大家看过这些词条之后,会对Sora的原理有更加清晰的理解。
视频生成
sora
词条
换脸
AI换脸:FaceFusion和Roop在线版修复,支持手机,平板,低配电脑!
在线使用AI换脸软
件
打开之后,就可以和本地离线版一样使用了。
FaceFusion
Roop
AI换脸
大模型
人话聊AI大模型:AIGC如何助力营销的秘密(上)
Jasper为用户提供超过60个模板,协助撰写广告文案、标语、网页文案、电子邮
件
、博客以及社交媒体文章等多种场景的内容。
大模型
QWen1.5: 卓越模型之路
Qwen1.5结构对比 在了解QWen1.5性能表现后,我们来跟随代码查看下QWen1.5模型的结构: huggingface的文
件
中没有给出qwen1.5的modeling文
件
,但是可以通过安装transformers
Qwen1.5
开源模型
OpenAI
Prompt逆向工程:轻松复刻OpenAI“神级”提示词
等待用户响应: 仅在满足(特定条
件
,例如“收到回应后”)时才进行下一步。
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
5、简化的训练流程: 相比传统模型,F5-TTS不需要复杂的组
件
如持续时间预测器、文本编码器或音素对齐模块。
F5-TTS
音频克隆
视频
厉害了,匹诺曹Pinokio!所有AI工具,一键安装,全部免费!整合AI绘画、AI视频、AI语音...
你可以浏览这些内容,找到你喜欢的内容,点击他,它会提示我安装相应软
件
。
AI绘画
AI视频
AI音乐
Fastwhisper + Pyannote 实现 ASR + 说话者识别
/data/models/speaker-diarization-3.1/config.yaml") 只下载这一个模型是不行的哦,这个只是个config文
件
,你还要下载另外两个模型: https:/
faster-whisper
语者识别
ASR
<
...
77
78
79
80
81
82
83
84
85
86
>
1
2
4
5
6
7
8
9
100