首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· stable diffusion API 调用,超级详细代码示例和说明
· 使用ComfyUI玩SDXL的正确打开方式
· ComfyUI的特性以及安装流程
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
最强开源数字人对口型系统介绍
Easy-Wav2Lip: 仓库地址: https://github.com/anothermartz/Easy-Wav2Lip/ 说他最强,指的是跟同类开源方法做对比,对口型时候无需额外
训
练
数字人
开源模型
RAG
检索增强生成(RAG)有什么好的优化方案
图1 RAG
工
作流
程
(with memory) 从RAG的
工
作流
程
看,能优化的模块有:文档块切分、文本嵌入模型、提示
工
程
优化、大模型迭代。
RAG
检索增强生成
对于AI,我们现阶段可以有的态度
包括AI绘画也一样,会用会玩,图个新鲜有趣,自然很容易就能上手使用;但如果要想做到可以落地商用的
程
度,就需要你投入相对应的时间成本来深入学习和熟
练
掌握了。
文生图
商汤
冲击传统模特,商汤发布高质量虚拟试衣Diffusion模型
在
训
练
过
程
中,由于无法获得同一人穿着不同衣服的数据对,因此使用从图像中提取的与衣服无关的图像和目标人物衣服的模板图像来重建图像。
文生图
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速
训
练
并实现实时因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
健康
教小朋友学习AI绘画的同时避免生成不健康图片
像Stable Diffsion这种开源软件,自己用的时候,经常会有意无意的生成NSFW(简单翻译是
工
作时间不宜点开,主要是涩涩图),但很多中小平台也在使用该软件,如果出现不健康图片,怕是要关停网站了,
小朋友
绘画
换脸
除了深度换脸、模拟配音,还能口型匹配的AI软件出现了
创始人Gaurav Misra来自印度新德里,曾是Snap的设计
工
程
主管。
AI
RAG
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
如前文LLM应用架构之检索增强(RAG)的缘起与架构介绍,RAG架构很好的解决了当前大模型Prompt learning过
程
中context window限制等问题,整体架构简明清晰,易于实现,得到了广泛的应用
大模型
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
CM3leon是第一个使用从纯文本语言模型改编的方法进行
训
练
的多模态模型,包括大规模检索增强预
训
练
阶段和第二个多任务监督微调(SFT)阶段。
文生图
Comfy肖像大师 非常推荐
ComfyUI Portrait Master 是一个用于生成人物肖像提示词的模块,旨在优化肖像生成过
程
。
comfyui
文生图
【AI绘画】入门英文名词解析
编译后直接使用的
工
具软件(例如:Office软件、WinRAR压缩软件等等)可以安装使用,断网也不受影响 但只有
程
序 没有代码 并不能学习到如何实现的 除了使用软件本身带的扩展接口外进行编
程
开发
文生图
AI绘画
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
用户将自己的个人头像上传后,可借助 Stable Diffusion 模型进行
训
练
,并生成一款拥有不同风格的个人头像。
开源模型
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
Sora采用Diffusion Transformer (DiT)架构进行
训
练
。
视频生成
sora
大模型
EduChat:教育行业垂直领域大模型
第二个挑战:教育领域的知识在不断更新,而LLMs由于
训
练
机制无法学习到最新的知识。
教育
大模型
垂直领域
ChatGLM
手把手带你微调一个自己的 ChatGLM2-6B 模型
ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预
训
练
与人类偏好对齐
训
练
,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、
ChatGLM2-6B
<
...
40
41
42
43
44
45
46
47
48
49
...
>
1
2
4
5
6
7
8
9
100