首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
微调、训练大模型概念介绍及论文笔记:Tuning系列论文笔记
P-tuning不改变预训练阶段模型参数,而是通过微调寻找更好的连续prompt提示,来引导已学习到的知识的使用;Fine-tuning可能在调整模型参数过程中,可能带来了灾难性遗忘问题 提示微调
v2
训练
微调
Midjourney
AI绘画 | Midjourney高质量肖像提示词的写法(附50+肖像提示词prompt)
一、逼真肖像提示词的注意事项 1.确保使用 -v 5 以上模型大家都知道Midjourney的模型从
V2
-V5,生成的图像质量也越来越高,目前最新版本是V5.2,真正在逼真度上有质的飞跃的是从V5
文生图
大模型
“实时”语音翻译!AI语音具有“情绪”!最强开源AI大模型来了
seamless-communication是基于神经网络的模型,它使用了多种技术,融合了SeamlessM4T
v2
多语言性、SeamlessStreaming 的低延迟性、 SeamlessExpressive
大模型
开源模型
语音
大模型
大模型实践总结
P-Tuning
v2
:让Prompt Tuning能够在不同参数规模的预训练模型、针对不同下游任务的结果上都达到匹敌Fine-tuning的结果。
大模型
训练
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
§ 为了避免扩散方法在一些无结构区域产生幻觉,还引入了一种新的交叉蒸馏方法,通过AlphaFold-Multimer
v2
预测的结构数据来丰富训练数据。
AlphaFold
3
蛋白
预测
大模型
腾讯开源混元AI绘画大模型
(Optional) Install flash attention
v2
for acceleration (requires CUDA 11.6 or above) python -m
腾讯
混元
文生图
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
o o • 2024-05-08 集成大模型
DeepSeek
o o • 2024-04
OCR
RAG
开源
再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」
因此,作者选择了 DINO-
V2
作为 ID 提取器的底座,使用单个线性层将 ID 提取器的 token 对齐到预训练的文本到图像的 UNet 中。
Anydoor
文生图
语音
字正腔圆,万国同音,coqui-ai TTS跨语种语音克隆,钢铁侠讲16国语言
install pydantic<2 coqui-ai TTS语音克隆模型配置 随后下载2.0版本的模型,下载地址: https://huggingface.co/coqui/XTTS-
v2
coqui-ai
TTS
语音
RAG
Langchain中改进RAG能力的3种常用的扩展查询方法
StrOutputParserimport numpy as np cross_encoder = CrossEncoder('cross-encoder/ms-marco-MiniLM-L-6-
v2
检索增强生成
Langchain
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
很熟悉的感觉吧,很像tfidf,也跟RetroMAE-
V2
的第二部分特征很相似,这部分特征更在意文本中各个token的信息,重要的token就赋予更高的权重。
BGE
M3-Embedding
多语音检索
前半年,我看到的有趣的 AI 产品
11、阿里最新推出了Mobile-Agent-
V2
,这是一个具有视觉感知功能的自主多模态移动设备代理。
AI工具
手把手教你用 SD 生成文字形状的光线,用来做营销宣传图非常有效
https://huggingface.co/ioclab/control_v1p_sd15_brightness/tree/main 将模型文件放到 \novelai-webui-aki-
v2
图像文字
ControlNet
Stable
Diffusion
大模型
万字长文,AI大模型的应用实践总结
· BianQue:一个经过指令与多轮问询对话联合微调的医疗对话大模型,基于ClueAI/ChatYuan-large-
v2
作为底座,使用中文医疗问答指令与多轮问询对话混合数据集进行微调。
大模型
大模型
Meta无限长文本大模型来了:参数仅7B,已开源
对于 LLAMA2 模型,该研究使用 Flash-Attention
V2
加速全注意力的计算。
Meta
长文本
大模型
<
1
2
3
4
5
6
>
1
2
4
5
6
7
8
9
100