首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 从零开始用LangChain、Pinecone和LLMs搭建你自己的文档问答系统
· 20个ChatGPT超实用的提示词(Prompt)
· ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
· 【万字长文】LLaMA, ChatGLM, BLOOM的参数高效微调实践
· 如何修复GPT幻觉、及评估数据集的挑战
· 真超越了GPT?国产大模型实用场景横评②
· Stable Diffusion 加速/优化/升级 优化出图速度
· TrOCR——基于transformer模型的OCR手写文字识别
· 制作可爱的表情包
· 2023检索增强生成技术(RAG)研究进展
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
必读!RAG好用的3种Router
生
成软标签: 创建专家预测数据集后,选择收集的一个指标来
生
成软标签(第三步)。
RAG
Router
RAG
如何提高RAG 的效果
这篇文章不分析
具
体的细节实现,旨在从解决思路上进行探讨,当前环境下如何提高RAG 的效果。
RAG
大模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
F5-TTS在公共的100K小时多语言数据集上进行训练,展现出高自然性和表现
力
的零样本能
力
、无缝代码切换能
力
和速度控制效率。
F5-TTS
音频克隆
Agent
LangChain Agent原理介绍
工
具
代码 from langchain.tools import BaseTool # 搜索
工
具
class SearchTool(BaseTool): name = "Search
langchain
Stable Diffusion
Stable Diffusion | 常见问题清点汇总
二、
生
成图片出现块状马赛克 原因是版本不兼容,解决方案: SDXL1.0版本:所有的大模型,LoRA,ControlNet等,都要升级统一为带有XL版本的模型,有时候
Stable
Diffusion
问题汇总
大模型
玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍
3.停止milvus 停止Milvus独立运行: docker-compose down 4.使用 Milvus 提供cli 客户端
工
具
来连接数据库,我可以在github下载该
工
具
https
向量数据库
LLM
ChatPDF | LLM文档对话 | pdf解析关键问题
我认为这确实是一个重要且有挑战性的
工
作,但是今天要讨论的文本是有一个前提条件的,那就是有标题(目录)存在。
大模型
大模型
领域大模型LLM训练Trick
问题二:领域数据训练后,通用能
力
往往会有所下降,如何缓解模型遗忘通用能
力
?
垂直
训练
大模型
GGUF格式详解
Value:
具
体的元数据内容。
GGUF
大模型
一文彻底搞懂多模态 - 多模态推理
这些实体可以是
具
体的人、地点、事物,也可以是抽象的概念或思想。
多模态推理
大模型
Stable Diffusion
AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
在原始的 U-Net 基础上,插入了交叉注意
力
模块,巧妙地引入了我们输入的 prompt 文本描述信息,从而帮助我们随心所欲地控制 AI 绘画的内容。
Stable
Diffusion
DALL·E
数字人
数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
WebUI
工
具
: 集成
工
具
包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和
数字人
声音克隆
GPT-SoVITS
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
该模型的性能在一些公开的语音识别数据集上达到了与有监督学习相当甚至超越的水平,展示了无监督语音识别的巨大潜
力
。
Translatotron
语音识别
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
但是随着transformer模型attention注意
力
机制进入计算机视觉任务,我们同样可以使用transformer来进行计算机视觉方面的任务,比如对象检测,对象分类,对象分割等,这里毕竟著名的模型
OCR
手写
文字识别
大模型
大模型的最大bug,回答正确率几乎为零,GPT到Llama无一幸免
经过了一系列实验,他们给出的初步证据证明:逆转诅咒会影响最先进模型中的泛化能
力
(图 1 和 B 部分)。
大模型
<
...
92
93
94
95
96
97
98
99
100
101
...
>
1
2
4
5
6
7
8
9
100