首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 阿里Qwen3系列模型惊艳亮相
· 最佳开源文生图大模型可图:安装与批量出图的完整教程
· 炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
· 【工具书】文生图常用的正向反向提示词以及常用词中英文对照表
· 【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
· Playground v2:超越SDXL的模型来了,优于SDXL 2.5倍!
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
· 全球六大主流自动PPT制作工具
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
如何提高RAG 的效果
下面笔者会根
据
实践的经验和收
集
到的信息进行汇总并记录下来。
RAG
大模型
SDXL
SDXL模型lora训练参
数
详细设置,显存占用22G,不用修脸原图直出
很多人纠结lora训练用谁的脚本比较好,比如kohya_ss的、秋葉aaaki的、赛博炼丹炉的…… 昨天我看了下kohya_ss的,感觉界面还是有点复杂,所以我还是最推荐秋叶的,秋叶也是用的kohya的脚本
集
成的
SDXL
训练
开源
来个优秀的开源人脸识别项目!
通过计算机与光学、声学、生物传感器和生物统计学原理等高科技手段的密切结合,将人体固有的生理特征或行为特征收
集
起来,进行取样、
数
字化处理和分析。
人脸识别
开源项目
大模型
智源:70万预算,从头开发千亿参
数
大模型,挑战成功!
要知道,当GPT-3的训练成本可是高达460万美元,近一些的Llama2
据
估算也大概是这个
数
。
大模型
Agent
AI Agent的
数
字化革命:超越文本,走向自主决策与交互
自主代理,如Auto-GPT,它能够根
据
人们通过自然语言提出的需求,自动执行任务并实现预期结果。
生成式AI
大模型
Github上Star
数
最多的大模型应用基础服务:Dify 深度解读
,经过总结为每一个分段生成 Q&A 匹配对,当用户提问时,系统会找出与之最相似的问题,然后返回对应的分段作为答案,实际的流程如下所示: 从上面的流程可以看到,Q&A 模式下会根
据
原始文档生成问答对
Dify
大模型
知识库
OpenAI
【语音识别】OpenAI语音力作Whisper
在68万小时标注
数
据
的加持下,预训练 Whisper 模型表现出了强大的泛化到多种
数
据
集
和领域的能力。
语音转文字
whisper
大模型
大模型能力评估体系
据
中国科学技术信息研究所的
数
据
,国内具有超过10亿参
数
规模的模型已达79个,标志着一场规模宏大的“百模大战”。
大模型
评估
使用BELLE项目部署bloomz模型(专业程序员精简版)
中文对话大模型ELLE(BE Large Language Model Engine),基于BLOOM和LLAMA针对中文做了优化,模型调优仅使用由ChatGPT生成的
数
据
,为中文指令提供更好的支持。
belle
训练
大模型
开源
这个
数
字人开源项目太牛了,非常全面的项目解决方案(含源码)
动作控制:Fay控制器可以控制
数
字人的动作和表情,使
数
字人能够根
据
应用场景进行相应的表演和互动。
Fay
开源项目
数字人
ComfyUI
用ComfyUI整了一套照片转Q版手办的工作流
之所以要搞这个,主要是因为它跟我目前要做的很多内容都息息相关,比如2D图片转3D模型,blender的插件、图片生成视频等,而且
据
说生成速度很快,对设备的要求低。
comfyui
文生图
ComfyUI
ComfyUI学习笔记2,一文看透Workflow
所谓Workflow工作流,在ComfyUI这里就是它的节点结构及
数
据
流运转过程。
comfyui
文生图
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
△开发者星云爱店CTO大董提供的测试资料,文图
数
据
均脱敏 总之,凭借强大的长文本和多模态处理能力,无论是在to B还是to C场景,Yi都能构建出高效的大模型应用。
零一万物
YI
李开复
开源
令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
然而,该模型通常缺乏对特定领域
数
据
的理解能力,特别是在解释图表
数
据
时。
ChartLlama
开源模型
图标
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和图片OCR)
,再到复杂的检索(如RAG),都需要我们首先从真实世界提取文本
数
据
。
大语言模型
python
<
...
9
10
11
12
13
14
15
16
17
18
...
>
1
2
4
5
6
7
8
9
100