首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 【语音领域-又双叒更新】阿里开源FunAudioLLM: 2大核心模型、5大亮点功能!效果炸裂!手把手带你理论+实战部署推理!
· Stable Diffusion 加速/优化/升级 优化出图速度
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型套壳祛魅:质疑套壳,理解套壳
· 微信搜狗爬虫WechatSogou - 从微信公众号获取文章的利器
· 【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程
· 【工具书】文生图常用的正向反向提示词以及常用词中英文对照表
· 几款开源的OCR识别项目,收藏备用
· 什么情况用Bert模型,什么情况用LLaMA、ChatGLM类大模型,咋选?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
借题发挥下最近几例声音克隆的应用案例
最近接连接到几个客户找我订制声音的案例: 1.某父亲痛失爱子,因为儿子托梦告知人是可以复活的,于是这位父亲到处寻找让人复活的办
法
,于是他关注到了最新的人工智能技术,开始找人咨询和学习技术,通过摸索,他知道通过
声音克隆
数字人
开源
ChatGLM3-6B:新一代开源双语对话语言模型,流畅对话与低部署门槛再升级
尽管模型在训练的各个阶段都尽力确保数据的合规性和准确性,但由于 ChatGLM3-6B 模型规模较小,且模型受概率随机性因素影响,无
法
保证输出内容的准确。
ChatGLM3
语音模型
开源模型
开源
开源免费离线语音识别神器whisper如何安装
本文目的 网络上有些教程只展示了whisper使用的效果,没有介绍怎么安装,为避免大家在安装上踩坑,同时也为了避免自己以后万一哪天电脑崩溃需要重装whisper的时候再踩坑,我在这里记录下安装方
法
。
wisper
翻译
免费
SD 美颜修图神器
Noise alpha「噪点阿尔
法
」分别设置 0、0.1 和 0.5,官方推荐 0.1,值越大,图像噪点越多。
SD
文生图
ChatGPT
模拟ChatGPT流式数据——SSE最佳实践(附可运行案例)
可以使用 addEventListener 方
法
在当前 EventSource 对象上监听任意类型的命名事件。
GPT
Github
GitHub工程师分享开发Copilot所采用的提示词工程
总的来说,他们建议的方
法
是基于一系列步骤的。
开源模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
2、流匹配技术: F5-TTS中采用了先进的流匹配技术,这是一种基于最优传输路径的方
法
,用于改进生成模型的学习过程。
F5-TTS
音频克隆
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
下面是模型结构示意图 下面是并行去噪算
法
示意图 MuseTalk:实时高质量口型同步模型 值得一提的是,MuseV团队最近发布了MuseTalk,这是一个实时高质量的口型同步模型,可以与MuseV
MuseV
视频
数字人
框架
Stable Diffusion
stable diffusion 远端跑图—— Api基础知识掌握
; "sd_model_checkpoint" :"wlop-any.ckpt [7331f3bc87]"}, // 一般用于修改本次的生成图片的stable diffusion 模型,用
法
需保持一致
文生图
api
儿童
AI赋能实验室:儿童绘本插图
--ar 16:9 --v 6.0 --s 250 --style raw 译文: 这是一个充满奇妙想象的儿童插图,描绘了一个充满好奇的[动物]在一个充满活力和魔
法
的[地点]展开了一段愉快的冒险
插画
文生图
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
CM3leon是第一个使用从纯文本语言模型改编的方
法
进行训练的多模态模型,包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。
文生图
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
在这篇博客文章中,我们将深入研究这两种方
法
在LlamaIndex中的实现。
RAG
检索
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
无监督的嵌入映射(Unsupervised Embedding Mapping):这是一种可以把不同语言的语音或文字的内部表示,映射到一个共同的空间的方
法
。
Translatotron
语音识别
RAG
LangChain - RAG:线上系统多文档要频繁更新,每次都要重新花钱做一次 embedding,老板不批预算,批我...
之前针对没个 chunk 做一次 hash,记录下来 hash 值,每次源数据更新了只需要在这一步里面比对一下,更新的 chunk 对应的 embedding 删掉,生成新的插入到原有向量数据库中就好,类似的方
法
大模型
AI改变未来,ChatDoc手把手教你写研报
需要强调一个前提,AI再好,也是工具,如果你缺乏对相关领域(比如,财报常识)的知识体系,就无
法
高效的和AI互动。
大模型应用
写作
<
...
72
73
74
75
76
77
78
79
80
81
...
>
1
2
4
5
6
7
8
9
100