首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 国内厂商语音识别与Whisper评测:现状与概况对比
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 20个ChatGPT超实用的提示词(Prompt)
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
爆火!腾讯开源PhotoMaker:高效地定制化生成任意风格的逼真人类照片!
对于所提出的PhotoMaker,首先分别从文
本
编码器和图像编码器中获得文
本
嵌入和图像嵌入。
PhotoMaker
文生图
大模型
企业如何更好的使用大模型?都有哪些框架和方案
AI技术
本
身不再是商业壁垒,数据才是。
人工智能
大模型
最顶尖的大语言模型人才,只关心这10个挑战
提高LLMs的速度和降低成
本
5.
大语言模型
一张照片秒生不同风格图像!小红书InstantID来了!
02 技术特点 · 零样
本
学习:InstantID不依赖于大量的训练数据,它能够直接从一张图像中提取身份特征,这对于资源有限的场景尤其有价值。
InstantID
文生图
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
其文
本
需要跟编码器的数据进行注意力机制的计算。
OCR
手写
文字识别
ComfyUI
ComfyUI安装及生成第一张图
请参阅官方
本
指南了解选项 2。
ComfyUI
文生图
大模型
无需翻墙,可合法使用的8款国内AI大模型产品
对用户端比较友好 3、智谱AI(GLM大模型) 主页网址:chatglm.cn 现在已经可以免费体验 「智谱清言」基于智谱 AI其自主研发的中英双语对话模型 ChatGLM2,经过万亿字符的文
本
与代码预训练
生成式AI
手把手教你用 SD 生成文字形状的光线,用来做营销宣传图非常有效
也可以从我这个百度云下载: 链接:https://pan.baidu.com/s/1pzxikDpuQMeUbAM_0HCdQA提取码:e8j0 图片生成 这个模型是前几天做SD生成二维码的时候火起来的,
本
质上还是控制图片的光线和深度信息
图像文字
ControlNet
Stable
Diffusion
AI知识库总是不准?教你无脑用GPT整理结构化数据集...
但是随之而来的,也是两个问题: 一、搭建成
本
高。
GPT
数字人
最强开源数字人对口型系统介绍
使用过原版开源的Wav2Lip的都知道,原作者使用分辨率很低的图像数据集训练的模型,嘴部特别清晰,基
本
没啥价值,但是 这个框架和算法倒是不错,如果想得到高清模型,得付出相当大的精力去收集高清数据集从头训练
数字人
开源模型
国产AI,逃过一劫
1月10日,北京硅动科技(硅基流动)官宣完成5000万元天使轮融资,其中创新工场领投,耀途资
本
、奇绩创坛以及王慧文等科技界知名人士跟投,华兴资
本
担任独家财务顾问。
ChatGPT
大模型
ChatGPT
ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
本
文很长,认真看完,一定对你有帮助!
ChatGPT
大模型
ChatGPT
Prompt全攻略(一):ChatGPT时代,什么是Prompt?
一段精心设计的Prompt文
本
,能让AI输出更准确、符合要求的内容。
prompt
大模型
分析过688篇大模型论文,这篇论文综述了LLM的当前挑战和应用
此外,他们更关注基于文
本
数据训练的模型。
开源模型
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
用户可以通过点击定位到文档中的原始文
本
,比较原文和处理后的文
本
之间的差异,并进行必要的编辑和修正,如添加、修改或删除信息。
OCR
RAG
开源
<
...
64
65
66
67
68
69
70
71
72
73
...
>
1
2
4
5
6
7
8
9
100