首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· Pynsist:一键打包 Python 应用代码成 Windows 安装程序
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 不出所料,字节个把月就整出了自己的manus,不用积分,无需会员,快来体验coze空间吧
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 耗时7天,终于把15种ControlNet模型搞明白了
· 这个方法可以让AI写出的文章完全去掉GPT味儿!
· 如何估计大模型所需要的显存大小?HuggingFace发布Model Memory Calculator,一键计算大模型显存需求
· [开源]面向中小团队的轻量化知识管理应用,构建知识库和知识社区
· Stable Diffusion 和 Midjourney的优劣势比较,如何选择?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
用上这10条神指令(prompt),让ChatGPT快速写出优质高分科研论文
二、总结论文要点:1、阅读并消
化
指定标题的研究论文内容,提供一个简洁明了的总结,包括主要发现、方法、结果和研究意义。
prompt
ChatGPT
写作
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
那么对于现在基于 CLIP 视觉词表的多模大模型也是一样的,遇到 “foreign language image”,如一页论文密密麻麻的文字,很难高效地将图片 token
化
,Vary 提出就是解决这一问题
OCR
手写
文字识别
ComfyUI
AA大佬新作:ComfyUI整合包,打造极简解决方案
ComfyUI整合包的介绍: AA发布的ComfyUI整合包是一个预装了大量节点的版本,它不仅简
化
了安装过程,还提供了一个启动器,用于完成节点的更新和安装。
comfyui
文生图
工作流程
Nvidia发布Llama3-ChatQA-1.5: 提升对话问答和表格推理能力,平均性能超越GPT-4
相比之前的ChatQA 1.0版本,其训练方法和数据集都进行了优
化
,尤其增强了对表格数据和算术计算的理解能力。
Llama3-ChatQA-1.5
对话问答模型
Agent
Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
也就是说你按照他的配置,可以复制出一个一模一样的bot,也可以在他的基础上优
化
、借鉴。
Kimi
扣子Coze
大模型
RAG
RAG与Long-Context之争—没必要争
当然目前有一些优
化
方法,滑动窗口、Cache量
化
等等等(欢迎大家补充),但即使这样由于大模型参数规模较大,显存占用也是很可怕的。
RAG
Long-Context
大模型
OCR
14.6K star!最好用的OCR文字识别项目,没有之一!
项目是基于PaddleOCR开发的,支持截图识别、批量导入识别、个性
化
识别等功能。
Umi-OCR
开源项目
文字识别
大模型
链接大模型与外部知识,智源开源最强语义向量模型BGE
语义向量模型(Embedding Model)被广泛应用于搜索、推荐、数据挖掘等重要领域,将自然形式的数据样本(如语言、代码、图片、音视频)转
化
为向量(即连续的数字序列),并用向量间的“距离”衡量数据样本之间的
embedding
语义向量
Stable Diffusion
【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
VAE美
化
模型/变分自编码器 VAE,全名Variational autoenconder,中文叫变分自编码器。
文生图
SD
Stable Diffusion
stable diffusion最全18种controlnet模型,详细教程讲解。
这个是根据下面这张图转的真人风格,谁还不会过来打屁股 聊会正题 首先了解一下controlnet能干什么,就是控制,可以用调色来比喻,无论是图片调色还是视频调色都要用到很多工具,白平衡校准,色温,色相饱和度,亮度,蒙版降噪,锐
化
,
Stable
Diffusion
文生图
controlnet
语音
「语音识别的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
实践应用:Distil-Whisper的广阔天地 Distil-Whisper的轻量
化
和高效性能使其在多种实际应用场景中大放异彩。
Distil-Whisper
语音识别
SD 美颜修图神器
Sharpeness「锐
化
值」分别设置 -3、1 和 3,这里可能小伙伴们看不太出来哈,如果放大了看,是可以看到图片越往右越清晰的。
SD
文生图
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 支持语音、视频和数据流处理,内置了自动语音识别(ASR)和文本转语音(TTS)功能,简
化
了语音到文本和文本到语音的转换过程。
GPT-4o
语音交互
再也不用担心 AI 图片脸崩手崩了
MediaPipe 提供专门的人脸检测模型,并对性能和准确性进行了优
化
。
ADetailer
安装
文生图
ChatGPT
ChatGPT提示工程 - 总结
ChatGPT提示工程的两个关键原则 - 吴恩达和OpenAI合作 编写Prompt的两个关键原则 原则一:编写清晰、具体的说明 策略1:使用分隔符清晰地标识出输入的各个部分 策略2:提示模型以结构
化
格式输出结果
GPT
<
...
69
70
71
72
73
74
75
76
77
78
...
>
1
2
4
5
6
7
8
9
100