文章列表-AI魔法学院

文章列表

万字长文｜40万人学习过｜28个ChatGPT使用技巧，带你从入门到精通

但ChatGPT的GPT-4模型已经进化成GPT-4-turbo，有了更强的上下文理解能力，更长的文本记忆，能理解图片、生成图片，以及更会使用网页浏览、代码解释器等工具帮助用户完成任务，所以我预期会在2024

ChatGPT 使用技巧教程

让你每次都随机生成各种图片，开盲盒的感觉：SD插件之无限抽卡神器Dynamic Prompts

可以看到刚刚导入的各个模版，我这里新加几个衣服模版进去，就可以出很多不同服装的图像。

文生图

阿里AI黑科技大揭秘：从通义千问到FaceChain，让图片和视频焕发新生！

一个静态图片转视频的项目。

阿里云视频音频

解读：一个数学在线教育网站如何做到一千万月访问量

老外的乘法表有意思，是一个正方形，这里也提醒我们出海做网站时，需要了解当地的文化，不能按照国内的理解去做。

访问量

【全文翻译】微软166页论文解读 GPT-4V：多模态大模型的黎明

医学图像理解。

多模态大模型 GPT-4V 文生图

PhotoMaker：腾讯最新开源，根据照片生成该人物各种风格图片，项目可落地！

项目简介 PhotoMaker是腾讯最近开源的照片生成工具，这是一种高效的个性化文本到图像生成方法。

PhotoMaker 文生图

鹅厂最新AI工具刷屏！杨幂寡姐多风格写真秒秒钟生成，LeCun点赞 | 可免费体验

值得注意的是，他们这里强调了，他们不会进行人脸检测，但上传的图片人脸已经要占据图片大部分。

PhotoMaker 图生图

四种微调技术详解：SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法

这一阶段的目标是使模型获取通用的语言理解和推理能力。

大模型

图片生成速度最高提升10倍！可以做到“实时”生成！清华推出LCM/LCM-LoRA！

近年来，随着SD和Midjourney的火热，文本到图像生成（Text-to-Image Generation）的研究取得了令人瞩目的进展，让我们能够用自然语言指导AI创造出各种各样的图像。

LCM/LCM-LoRA 文生图

斯坦福宣布前端开发要失业了？！一张截图生成代码，64%优于原网页！

随着生成型人工智能（AI）的飞速发展，多模态理解和代码生成的能力达到了前所未有的水平。

设计转代码大模型

手把手教你用 SD 生成文字形状的光线，用来做营销宣传图非常有效

昨天类似这种文字光效或者将文字合成在衣服上的图好像又火了，很多朋友在问怎么做，其实就是ControlNet的简单应用，比如模拟光线照射文字的，之前用来调整自然光线的角度和范围这次不过是将原来模拟光照的图变成了文字了

图像文字 ControlNet Stable Diffusion

万字长文震撼来袭！揭秘Transformer——吐血解读自注意力机制的革命性突破

Transformer遵循这种总体架构，使用堆叠的自注意力机制和逐点、全连接层，分别用于编码器和解码器，如图1的左半部分和右半部分所示。

Transformer 大模型

探索Sora的魔法世界：功能展示、原理解析、未来市场影响大猜想！

这标志着我们如何理解和创造虚拟世界的方式即将迎来根本性的变革。

视频生成 sora

免费的文本生成视频解决方案：AnimateDiff下载-可用于StableDiffusion的webui以及ComfyUI

AnimateDiff 是一个基于 Stable Diffusion 模型的文本生成视频插件，它通过控制模块影响图像生成过程，使得生成的图像序列具有与训练视频剪辑相似的特征。

视频生成文生视频

免训练！单图秒级别生成AI写真，人像生成进入无需训练的单阶段时代

面对这一问题，FaceChain 给出了解决方案：无需大量数据，无需训练等待，甚至无需训练，只需要一张图片 10 秒钟即可立即生成 AI 写真！

FaceChain FACT 文生图

<...11 12 13 141516 17 18 19 20 ...>

汇聚AI资讯，网罗AI文档，详解AI工具！

关于我们用户协议隐私条款商务合作：skillupvip

© 2023-2025 AI魔法学院

京ICP备20027199号-1