首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 通义千问
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· RAG模型的主要痛点和解决方案
· 使用ComfyUI玩SDXL的正确打开方式
· 爆肝!超详细的胎教级Midjourney使用教程,看这一篇就够!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AI文档智能助理都是如何处理pdf的?
进行
图
片处理。
大模型
大模型
从零开始了解AI大模型 - 技术篇:万字深度好文人话说大模型技术
经过微调后,这些模型可用于各种任务,包括分类、序列
标
记、结构预测和序列生成,同时还可以构建文摘、机器翻译、
图
片检索、视频注释等应用。
大模型
语音
国内厂商语音识别与Whisper评测:现状与概况对比
一、语音识别现状 二、评测意义与预期成果 三、评测方案 四、评测结果 一、语音识别现状 得益于近年来深度学习技术的快速发展,人工智能的主要分支(
图
像、语音、自然语言处理等)都相继进入了大规模落地应用阶段
语音识别
Faster-Whisper
视频
超越Animate Anyone! 南加大&字节提出MagicPose,不需任何微调就可生成逼真的人类视频
此外,MagicPose模块可以被视为原始文本到
图
像模型的扩展/插件,而无需修改其预训练的权重。
MagicPose
视频
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
其一是没有
标
注信息的弱监督数据,来自于从网上挖掘得到的各种有语义关联的数据,并过滤掉其中低质量的内容。
BGE
M3-Embedding
多语音检索
人工智能
准备迎接超级人工智能系统,OpenAI宣布RLHF即将终结!超级对齐技术将接任RLHF,保证超级人工智能系统遵循人类的意志
为什么要做弱AI监督引导强AI 如前所述,此前的强化学习是人类比模型强的情况下推出的如下
图
所示,是一个示意
图
: 在未来,我们面临的是人类需要监督和控制比自己更强大的AI系统。
OpenAI
人工智能
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
利用简单的 WER 启发式,他们只选择质量最高的伪
标
签进行训练。
语音
HeyGen
【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
这种严格的监督训练方式限制了模型的泛化性和实用性,因为这样的模型通常还需要额外的
标
注数据来完成训练时未曾见过的视觉“概念”。
OpenAI
自然语言监督
提示词
你要牢记的四个常用AI提示词框架:ICIO、CRISPE、BROKE、RASCEF,有助于获取更加稳定和高质量的内容
数据处理与转换:当用户需要 AI 处理特定的数据并按照特定格式输出时,如数据清洗、文本翻译或
图
像转换。
大模型
提示词
金融
金融领域Prompt工程方法浅析
Prompt工程流程(Financial Prompt Engineering Process,FinPEP),其概述
图
如
图
1所示。
prompt
大模型
大模型
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
给定一些示例和定量的成功指
标
,这些工具可迭代式地找到输送给 LLM 的最优语句。
prompt
大模型
提示
Microsoft
来自Microsoft Build 2023:大语言模型是如何被训练出来的
如下
图
所示: 预训练阶段的输入和目
标
做了tokenzier之后就可以针对数据集利用transformer模型进行训练。
大模型
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
TrOCR是transformer OCR的简写,是microsoft发布的一个OCR识别模型,光看这个模型的名字就知道此模型基于transformer模型,其模型架构如下,完全采用了
标
准的transformer
OCR
手写
文字识别
LLM
2023年LLM如何入门?请看这篇综述!
A:自从
图
灵测试在1950年代提出以来,人类一直在探索如何让机器掌握语言智能。
大模型
微调
NEFTune:在Embedding中加入噪⾳提⾼指令微调效果!
图
1:LLaMA2-7B模型在数据集微调时,使⽤和不使⽤NEFTune的AlpacaEval胜率百分比。
NEFTune
大语言模型
<
...
35
36
37
38
39
40
41
42
43
44
...
>
1
2
4
5
6
7
8
9
100