首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Ollama最新更新v0.1.33,实现了多并发可同时与多个模型聊天对话!
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 我尝试了 100 个免费 AI 工具,这些是最好的
· 秘塔AI搜索
· 万字长文|40万人学习过|28个ChatGPT使用技巧,带你从入门到精通
· Stable Diffusion WebUI v1.8.0重大更新!
· 通往AGI之路:什么是结构化提示词
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
商汤
冲击传统模特,商汤发布高质量虚拟试衣Diffusion模型
在
训
练
过
程
中,由于无法获得同一人穿着不同衣服的数据对,因此使用从图像中提取的与衣服无关的图像和目标人物衣服的模板图像来重建图像。
文生图
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
不需要复杂的设计如持续时间模型、文本编码器和音素对齐,能够快速
训
练
并实现实时因素(RTF)0.15的推理速度,显著优于当前基于扩散的TTS模型。
F5-TTS
音频克隆
健康
教小朋友学习AI绘画的同时避免生成不健康图片
像Stable Diffsion这种开源软件,自己用的时候,经常会有意无意的生成NSFW(简单翻译是
工
作时间不宜点开,主要是涩涩图),但很多中小平台也在使用该软件,如果出现不健康图片,怕是要关停网站了,
小朋友
绘画
【AI绘画】入门英文名词解析
编译后直接使用的
工
具软件(例如:Office软件、WinRAR压缩软件等等)可以安装使用,断网也不受影响 但只有
程
序 没有代码 并不能学习到如何实现的 除了使用软件本身带的扩展接口外进行编
程
开发
文生图
AI绘画
换脸
除了深度换脸、模拟配音,还能口型匹配的AI软件出现了
创始人Gaurav Misra来自印度新德里,曾是Snap的设计
工
程
主管。
AI
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
用户将自己的个人头像上传后,可借助 Stable Diffusion 模型进行
训
练
,并生成一款拥有不同风格的个人头像。
开源模型
RAG
改进召回(Retrieval)和引入重排(Reranking)提升RAG架构下的LLM应用效果
如前文LLM应用架构之检索增强(RAG)的缘起与架构介绍,RAG架构很好的解决了当前大模型Prompt learning过
程
中context window限制等问题,整体架构简明清晰,易于实现,得到了广泛的应用
大模型
大模型
EduChat:教育行业垂直领域大模型
第二个挑战:教育领域的知识在不断更新,而LLMs由于
训
练
机制无法学习到最新的知识。
教育
大模型
垂直领域
大模型
大模型检索增强生成RAG的优化
RAG
工
作流
程
(with memory) 从RAG的
工
作流
程
看,能优化的模块有:文档块切分、文本嵌入模型、提示
工
程
优化、大模型迭代。
RAG
检索增强
大模型
Sora
探索Sora的魔法世界:功能展示、原理解析、未来市场影响大猜想!
Sora采用Diffusion Transformer (DiT)架构进行
训
练
。
视频生成
sora
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
CM3leon是第一个使用从纯文本语言模型改编的方法进行
训
练
的多模态模型,包括大规模检索增强预
训
练
阶段和第二个多任务监督微调(SFT)阶段。
文生图
ChatGLM
手把手带你微调一个自己的 ChatGLM2-6B 模型
ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预
训
练
与人类偏好对齐
训
练
,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(+23%)、
ChatGLM2-6B
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
但是这些方法对于不在
训
练
数据内的新图象,泛化性较差,或者需要输入多个图像,在近一个小时后,才能等到生成结果。
Anydoor
文生图
RAG
2023检索增强生成技术(RAG)研究进展
然而,无论模型的规模如何增长,它们仍受限于
训
练
数据的质量和范围。
RAG
检索增强
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知识库
ChatGLM2-6B 使用了 GLM 的混合目标函数,经过了 1.4T 中英标识符的预
训
练
与人类偏好对齐
训
练
,评测结果显示,相比于初代模型,ChatGLM2-6B 在 MMLU(
知识库
<
...
40
41
42
43
44
45
46
47
48
49
...
>
1
2
4
5
6
7
8
9
100