首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 国产视频制作之光-可灵:提示词大全整理
· 建议收藏:超详细ChatGPT(GPT 4.0)论文润色指南
· 分享一个结构化AI提示词模版
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· MiniCPM 4.1 开源!代码、数学推理速度快了 3 倍!
· ChatGLM智谱清言
· 完整ChatGLM3部署教程,支持手机和车载平台部署
· 中文通用大模型评测基准发布,全方位解析评价维度,助你选出最优秀的模型!
· 用Midjourney给自己制作精美的logo或头像
· 和大模型相关的一些术语(持续更新中)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
语音、视频转文字神器:开源whisper介绍
下图展示了使用large-
v2
模型对Fleurs数据集进行的WER(词误率)语言拆解。
人工智能
大模型
wisper
Stable Diffusion
Stable Diffusion 必装插件查缺补漏,你还有哪个没装?(下)
安装完成后上传一张图像,然后选择一个反推模型(一般使用 wd14-vit-
v2
.git ),点击 Interregats 进行反推,就能得到关于图像的一组提示,并显示每个关键词的相关性权重。
文生图
Stable
Diffusion
大模型
大模型高效微调:🤗 PEFT 使用案例
✅ Deberta-
v2
大模型
大模型
回望做大模型一年后的感悟
大模型应该分为两类,一类是从头开始训练的基础模型,比如:Yi、QWen、Baichuan、ChatGLM、
DeepSeek
等等;另一类是continue pretraining和sft类别的模型。
大模型
感悟
大模型
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
P-tuning不改变预训练阶段模型参数,而是通过微调寻找更好的连续prompt提示,来引导已学习到的知识的使用;Fine-tuning可能在调整模型参数过程中,可能带来了灾难性遗忘问题 提示微调
v2
训练
微调
Midjourney
AI绘画 | Midjourney高质量肖像提示词的写法(附50+肖像提示词prompt)
一、逼真肖像提示词的注意事项 1.确保使用 -v 5 以上模型大家都知道Midjourney的模型从
V2
-V5,生成的图像质量也越来越高,目前最新版本是V5.2,真正在逼真度上有质的飞跃的是从V5
文生图
大模型
大模型实践总结
P-Tuning
v2
:让Prompt Tuning能够在不同参数规模的预训练模型、针对不同下游任务的结果上都达到匹敌Fine-tuning的结果。
大模型
训练
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
§ 为了避免扩散方法在一些无结构区域产生幻觉,还引入了一种新的交叉蒸馏方法,通过AlphaFold-Multimer
v2
预测的结构数据来丰富训练数据。
AlphaFold
3
蛋白
预测
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
seamless-communication是基于神经网络的模型,它使用了多种技术,融合了SeamlessM4T
v2
多语言性、SeamlessStreaming 的低延迟性、 SeamlessExpressive
大模型
开源模型
语音
大模型
腾讯开源混元AI绘画大模型
(Optional) Install flash attention
v2
for acceleration (requires CUDA 11.6 or above) python -m
腾讯
混元
文生图
语音
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言
install pydantic<2 coqui-ai TTS语音克隆模型配置 随后下载2.0版本的模型,下载地址: https://huggingface.co/coqui/XTTS-
v2
coqui-ai
TTS
语音
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
因此,作者选择了 DINO-
V2
作为 ID 提取器的底座,使用单个线性层将 ID 提取器的 token 对齐到预训练的文本到图像的 UNet 中。
Anydoor
文生图
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
o o • 2024-05-08 集成大模型
DeepSeek
o o • 2024-04
OCR
RAG
开源
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
很熟悉的感觉吧,很像tfidf,也跟RetroMAE-
V2
的第二部分特征很相似,这部分特征更在意文本中各个token的信息,重要的token就赋予更高的权重。
BGE
M3-Embedding
多语音检索
RAG
Langchain中改进RAG能力的3种常用的扩展查询方法
StrOutputParserimport numpy as np cross_encoder = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-
v2
检索增强生成
Langchain
<
1
2
3
4
5
6
7
>
1
2
4
5
6
7
8
9
100