首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用ChatGPT润色出高品质文章!
· 制作可爱的表情包
· humanize.im
· AIChatru.ru
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Dify:大模型创业开源工具,46,558 行代码,完全开源
· GitHub上很火的RPA框架:一款用于验收测试和 RPA 的通用自动化框架robotframework
· Suno音乐新手指南(手把手完整版教程)
· ComfyUI的特性以及安装流程
· ChatGLM智谱清言
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Midjourney
用Midjourney给自己制作精美的logo或头像
在
图
形设计领域,人工智能正在革新logo的创建方式。
头像
logo
LLM
PymuPDF4llm:PDF 提取的革命
(三)
图
像提取 1.
PymuPDF4llm
PDF
Stable Diffusion
Stable Diffusion教程:绘制3D风格的手办公仔
Stable Diffusion是一种强大的深度学习模型,能够将2D
图
像转化为具有丰富细节和质感的3D模型。
Stable
Diffusion
教程
3D
微调
NEFTune:在Embedding中加入噪⾳提⾼指令微调效果!
一.引用 在LLaMA2-7B这样的原始LLM中使⽤带有噪⾳嵌入进⾏微调时,其在AlpacaEval上的性能从29.8%提⾼到64.7%(
图
1
NEFTune
大语言模型
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
,而唇部区域只占整个
图
像的很小一部分(不到4%),因而无法聚焦唇部细节。
wav2lip
语音
OCR
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
下面是实测的一次看
图
说话任务,MiniCPM-V 2.0 出现了 3 处幻觉,GPT-4V 出现了 6 处幻觉(见
图
下高亮红字): 除了越来越强大的通用能力
MiniCPM
大模型
大模型
达摩院SPACE对话大模型:知识注入与知识利用
但是,本质上都还是语言模型,如上
图
右边的流程
图
所示,输入基本上为网络上的自由文本,模型基本上都是 Transformer 结构,优化的目标基本上都是 MLM(掩码语言模型)。
大模型
大模型
分析过688篇大模型论文,这篇论文综述了LLM的当前挑战和应用
图
1:LLM 挑战概况。
开源模型
用AI轻松玩转年度总结PPT
按输出分,AI 分为 对话 AI,
图
片 AI,视频 AI。
PPT
年终总结
ComfyUI
ComfyUI | 这么入门就顺了,硬入疼的是自己
基础工作流五核心板块(大模型、VAE、提示词、参数采样设置和生
图
窗口) 本人是三维软件爱好者,像OC渲染器这种节点连节点的看多了,看Comfy界面自带好感,但是直接看内容逻辑就有点卡眼睛,于是就从熟悉的
生成式AI
用AI生成PPT、用AI优化PPT!
生成的PPT颜色可以随时让它修改 生成的部分PPT 生成后的PPT,我发现部分配
图
和内容不对应,部分文字内容前后重复。
AI
ppt
Fastwhisper + Pyannote 实现 ASR + 说话者识别
wespeaker-voxceleb-resnet34-LM https://huggingface.co/pyannote/segmentation-3.0 最后再修改下config.yaml里的模型路径,参考我的: 在这里插入
图
片描述
faster-whisper
语者识别
ASR
RAG
一文看懂RAG:大语言模型落地应用的未来
RAG的演进轨迹在四个不同阶段展开,如下
图
所示。
rag
检索增强
人工智能
深入浅出人工智能常用技术,让你轻松掌握AI应用核心!
机器学习算法包括分类、聚类和回归等,这些算法在
图
像识别和语音识别中得到了很好的应用。
人工智能
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
这就好比你问了一个复杂的问题,RAG先跑去
图
书馆查资料。
OCR
RAG
开源
<
...
46
47
48
49
50
51
52
53
54
55
...
>
1
2
4
5
6
7
8
9
100