首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 主流网络爬虫蜘蛛详解
· 为你推荐开源项目:Meridian——专属个人情报站!
· 性能超出预期!神秘的国产大模型 Kimi 开放 API
· 【AI绘图工具】太爆炸了,AI出图速度100fps(每秒100张图片),比LCM、SDXL Turbo更快,目前No.1
· 推荐智能体:利用大模型进行交互式推荐
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 超详细的 Stable Diffusion ComfyUI 基础教程(二):文生图基础流程
· stable diffusion 远端跑图—— Api基础知识掌握
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
通过 LLM 极强的语言先
验
,这种架构还可以避免 OCR 中的易错字,比如“杠杆”和“杜杆”等, 对于模糊文档,也有望在语言先
验
的帮助下实现更强的 OCR 效果。
OCR
手写
文字识别
LLM
实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
ensp; 在没有 AI 之前,我的文章处理步骤是这样的: 1.一篇篇快速浏览,筛选信息 2.集合筛选过的信息,详细突击阅读其中内容 3.整理摘抄读过后认为重要的观点、论
证
、
Ollama
AnythingLLM
阅读
大模型
大模型在金融行业的应用场景
2.摩根士丹利为财务顾问及其团队提供基于私有数据的知识问答,保
证
答案100%来自源数据。
大模型
金融
应用
写作
AI 爆文写作:如何用GPT写出10万+?这篇五千字长文给你答案
你也可以提前收集一些你喜欢的、经受过市场
验
证
的标题,然后当作范例输入到对话中。
AI写作
GPT
SDXL
说真的,SDXL究竟藏着多少秘密,也许没人知道
这恐怕是个难以穷举的问题,要知道作为AI出图的特征之一,每张图都有对应一系列设定的唯一seed,有点像图片身份
证
的意思。
文生图
微调
微调大型语言模型-核心思想和方法介绍
请注意,不只是微调编
码
器样式的 LLM,相同的方法适用于类似 GPT 的解
码
器样式的 LLM。
大模型
训练
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
Erwin_15.wav|Erwin|ZH|因为艰辛着 Erwin_16.wav|Erwin|ZH|我才想能够得到
证
实 Erwin
Whisper
语音优化
Meta
学术党狂喜,Meta推出OCR神器,PDF、数学公式都能转
方法概述 本文架构是一个编
码
器 - 解
码
器 Transformer 架构,允许端到端的训练,并以 Donut 架构为基础。
大模型
大模型
大模型微调数据选择和构造技巧
我们简单地把已有的数据全部当成正样本打上1,然后待筛选的数据全部当成负样本打上0,我们使用deberta等构建二分类模型,并进行K-fold的交叉
验
证
,在交叉
验
证
过程中,选出每一个fold过程中的测试集合里概率接近于
大模型
微调
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
强大的预训练子模块:通过利用CLIP ViT-B16和OPT-125M这两个预训练模型,该架构在视觉编
码
、动作理解和语言处理方面都具有出色的性能基础。
Agent+GPT-4V
大模型
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
ChatTTS适用于大型语言模型助手的对话任务、对话语音和视频介绍等,这表明它可以集成到多种应用程序和服务中,提供更加自然和流畅的交互体
验
。
ChatTTS
语音合成
RAG
一文看懂RAG:大语言模型落地应用的未来
提升用户体
验
:在用户交互方面,如聊天机器人或虚拟助手,RAG能够提供更自然、连贯且信息丰富的对话体
验
。
rag
检索增强
开源
Falcon 180B 开源影响了谁?
比如英伟达的资深研究员Jim Fan就公开指出:Falcon-180B的训练数据中,代
码
只占5%,没有代
码
能力,就不能声称「优于GPT-3.5」或「接近GPT-4」。
大模型
大模型
大模型RAG检索增强问答如何评估:噪声、拒答、反事实、信息整合四大能力评测任务探索
然后,对生成的答案进行人工
验
证
,并如上所述检索相关文档。
大模型
RAG检索增强
视频
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
实
验
性功能。
AI语音克隆
实时语音识别
<
...
33
34
35
36
37
38
39
40
41
42
...
>
1
2
4
5
6
7
8
9
100