文章列表-AI魔法学院

文章列表

爆火！腾讯开源PhotoMaker：高效地定制化生成任意风格的逼真人类照片！

对于所提出的PhotoMaker，首先分别从文本编码器和图像编码器中获得文本嵌入和图像嵌入。

PhotoMaker 文生图

企业如何更好的使用大模型？都有哪些框架和方案

AI技术本身不再是商业壁垒，数据才是。

人工智能大模型

最顶尖的大语言模型人才，只关心这10个挑战

提高LLMs的速度和降低成本 5.

大语言模型

一张照片秒生不同风格图像！小红书InstantID来了！

02 技术特点 · 零样本学习：InstantID不依赖于大量的训练数据，它能够直接从一张图像中提取身份特征，这对于资源有限的场景尤其有价值。

InstantID 文生图

TrOCR——基于transformer模型的OCR手写文字识别

其文本需要跟编码器的数据进行注意力机制的计算。

OCR 手写文字识别

ComfyUI安装及生成第一张图

请参阅官方本指南了解选项 2。

ComfyUI 文生图

无需翻墙，可合法使用的8款国内AI大模型产品

对用户端比较友好 3、智谱AI（GLM大模型）主页网址：chatglm.cn 现在已经可以免费体验「智谱清言」基于智谱 AI其自主研发的中英双语对话模型 ChatGLM2，经过万亿字符的文本与代码预训练

生成式AI

手把手教你用 SD 生成文字形状的光线，用来做营销宣传图非常有效

也可以从我这个百度云下载：链接：https://pan.baidu.com/s/1pzxikDpuQMeUbAM_0HCdQA提取码：e8j0 图片生成这个模型是前几天做SD生成二维码的时候火起来的，本质上还是控制图片的光线和深度信息

图像文字 ControlNet Stable Diffusion

AI知识库总是不准？教你无脑用GPT整理结构化数据集...

但是随之而来的，也是两个问题：一、搭建成本高。

GPT

最强开源数字人对口型系统介绍

使用过原版开源的Wav2Lip的都知道，原作者使用分辨率很低的图像数据集训练的模型，嘴部特别清晰，基本没啥价值，但是这个框架和算法倒是不错，如果想得到高清模型，得付出相当大的精力去收集高清数据集从头训练

数字人开源模型

国产AI，逃过一劫

1月10日，北京硅动科技（硅基流动）官宣完成5000万元天使轮融资，其中创新工场领投，耀途资本、奇绩创坛以及王慧文等科技界知名人士跟投，华兴资本担任独家财务顾问。

ChatGPT 大模型

ChatGPT提示词万能模板：BRTR原则，让ChatGPT完美理解你的需求

本文很长，认真看完，一定对你有帮助！

ChatGPT 大模型

Prompt全攻略(一):ChatGPT时代,什么是Prompt?

一段精心设计的Prompt文本,能让AI输出更准确、符合要求的内容。

prompt

分析过688篇大模型论文，这篇论文综述了LLM的当前挑战和应用

此外，他们更关注基于文本数据训练的模型。

开源模型

7.1k Star！RAGFlow：最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务！

用户可以通过点击定位到文档中的原始文本，比较原文和处理后的文本之间的差异，并进行必要的编辑和修正，如添加、修改或删除信息。

OCR RAG 开源

<...64 65 66 676869 70 71 72 73 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1