首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· MCP服务介绍及应用场景报告-来自Manus
· 为你推荐开源项目:Meridian——专属个人情报站!
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· AI换脸工具:facefusion使用心得
· ChatGLM智谱清言
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
生成式AI工作流#产品经理和创业者的秘密武器
产品经理或交互设计师通常会使用Axure、Sketch或Figma等工具,投入主要的时间绘制线框
图
,并通过页面流程
图
来阐释产品的交互逻辑。
AIGC
工作流
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
那些经 AI 之手创作的
图
像,艺术风格极具创意且逼真形象。
开源模型
视频
AI视频新技能!这套流程教你打造视频人物和声音完美同步!
D-ID:https://studio.d-id.com/ HeyGen:https://app.heygen.com/home 如果你只需从单张
图
片生成与音频同步的视频,且对人物动作没有太多特殊要求
AI视频
阿里
四木测评|让教父唱《野狼disco》、恶搞《甄嬛传》,火遍全网的阿里明星项目EMO正式开放
而上传
图
片的限制,可能会让用户进行多次尝试——系统会校验
图
片像素大小、人脸清晰程度、非多人、版权风控、画风检测、不能有头部倾斜、露出手部等条件。
EMO
阿里
全民演唱
大模型
大模型微调方法总结
结合
图
片来看,LoRA 的实现流程如下: ● 在原始预训练语言模型(PLM)旁边增加一个旁路,做一个降维再升维的操作,来模拟所谓的内在秩。
开源模型
OCR
14.6K star!最好用的OCR文字识别项目,没有之一!
项目是基于PaddleOCR开发的,支持截
图
识别、批量导入识别、个性化识别等功能。
Umi-OCR
开源项目
文字识别
Microsoft
来自Microsoft Build 2023:大语言模型是如何被训练出来的
全文围绕如下的这个
图
展开: 这幅
图
很好地总结了大语言模型的训练全景,主要包括四个阶段: 预训练阶段:基于原始数据训练一个基础模型,得到的是一个base model,可以部署使用 有监督微调阶段
大模型
大模型
大模型检索增强生成RAG的优化
其技术架构
图
大致如下[4]: 基于KG+VS进行上下文增强
图
3中query进行KG增强是通过NL2Cypher模块实现的。
RAG
检索增强
大模型
大模型
大模型量化:什么是模型量化,如何进行模型量化
非饱和量化是最本质也是最暴力的方法,即通过统计网络模型中每一个层中权重或激活值的绝对最大值,将其映射到127,来计算出缩放因子scale,然后使用线性映射的方式将原始的浮点数据转换到INT8的数据域中,如下
图
(
大模型
OCR
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
下面是实测的一次看
图
说话任务,MiniCPM-V 2.0 出现了 3 处幻觉,GPT-4V 出现了 6 处幻觉(见
图
下高亮红字): 除了越来越强大的通用能力
MiniCPM
大模型
Fastwhisper + Pyannote 实现 ASR + 说话者识别
wespeaker-voxceleb-resnet34-LM https://huggingface.co/pyannote/segmentation-3.0 最后再修改下config.yaml里的模型路径,参考我的: 在这里插入
图
片描述
faster-whisper
语者识别
ASR
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
图
12: 掩码扩散变换器 (MDT) 的整体架构
图
。
sora
论文
微调
微调大型语言模型-核心思想和方法介绍
与上下文学习相关的是硬提示调整(hard prompt tuning)的概念,我们修改输入以希望改进输出,如下
图
所示。
大模型
训练
ComfyUI
ComfyUI | 这么入门就顺了,硬入疼的是自己
基础工作流五核心板块(大模型、VAE、提示词、参数采样设置和生
图
窗口) 本人是三维软件爱好者,像OC渲染器这种节点连节点的看多了,看Comfy界面自带好感,但是直接看内容逻辑就有点卡眼睛,于是就从熟悉的
生成式AI
阿里
阿里最近推出AI项目的动作太过频繁,脑子跟不上了,事出反常必有妖,盘点一下
一个静态
图
片转视频的项目。
阿里
大模型
<
...
32
33
34
35
36
37
38
39
40
41
...
>
1
2
4
5
6
7
8
9
100