首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 从零开始了解AI大模型 - 技术篇:万字深度好文人话说大模型技术
· PPT又又有新突破了!智谱AI代码流造PPT
· 如何用人工智能提升打工人的文案能力
· Stable Diffusion ComfyUI 入门感受
· ComfyUI的特性以及安装流程
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AIGC
AIGC系列之一-一文理解什么是Embedding嵌入技术
Embedding层往往是神经网络的第一层,它可以
训
练
,可以学习到对应特征的内在关系。
AIGC
Embedding
嵌入技术
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
对每个
数
据
样本(audio、text_label)依
据
对应语言随机从预
训
练
语音指令表(见第三节
数
据
部分)中选取一个指令,组成(audio,instruct,text_label)格式的
数
据
,并在
训
练
过程中预测
开源模型
大模型
分析过688篇大模型论文,这篇论文综述了LLM的当前挑战和应用
挑战 难以理解的
数
据
集
对于 LLM 而言,其预
训
练
数
据
集
的规模非常大,任何个人都无法彻底阅读其中的文档或评估这些文档的质量。
开源模型
开源
国内外开源大语言模型一览表
Stanford Alpaca 的种子任务都是英语,收
集
的
数
据
也都是英文,因此
训
练
出来的模型未对中文优化。
大模型
大模型
大模型套壳祛魅:质疑套壳,理解套壳
OpenAI 创始人之一、特斯拉前 AI 总监安德烈·卡帕西(Andrej Karpathy)在 2023 年 5 月的微软 Build 大会上透露:「预
训
练
就是在超级计算机中使
数
千个 GPU 以及可能进行
数
月时间来处理互联网规模
数
据
集
的地方
大模型
套壳
大模型
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
70 亿参
数
,并提供了预
训
练
以及针对对话、指令遵循、有用性和安全性微调的 checkpoint。
开源模型
Gemma
ChatGLM
清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench:GPT-4是全能战士,超越所有模型
清华大学KEG与
数
据
挖掘小组(发布ChatGLM模型)发布了一个最新大模型AI Agent能力评测
数
据
集
,对当前大模型作为AI Agent的能力做了综合测评。
GPT-4
开源
M3E 可能是最强大的开源中文嵌入模型
模型地址: https://huggingface.co/moka-ai/m3e-base M3E Models 是使用千万级 (2200w+) 的中文句对
数
据
集
进行
训
练
的
开源模型
大模型
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
数
据
预处理:这涉及特征缩放和归一化、处理缺失
数
据
、异常值检测、分类
数
据
编码以及将
数
据
分割为
训
练
集
、验证
集
和测试
集
。
LLM
大模型
GitHub
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
在
训
练
完成后,wav2lip模型根
据
音频信息逐帧生成一个说话的人脸视频。
wav2lip
语音
【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
这种严格的监督
训
练
方式限制了模型的泛化性和实用性,因为这样的模型通常还需要额外的标注
数
据
来完成
训
练
时未曾见过的视觉“概念”。
OpenAI
自然语言监督
Prompt
自动优化Prompt:Automatic Prompt Engineering的3种方法
第二步:在
训
练
集
上打分,并保留高分prompt 打分方式有两种: Execution accuracy。
prompt
大模型
用户意图对齐,无需人工标注,Zephyr-7B 超越 Llama2-Chat-70B
首先通过dSFT进行基础的模型
训
练
,然后通过AIF收
集
反馈并对模型进行评分和排序,最后通过dDPO根
据
这些反馈优化模型的偏好。
小型语言模型
Zephyr-7B
大模型
LLM大模型推理输出生成方式总结
参
数
设置:do_sample = False, num_beams = 1 缺点: 1、生成文本重复 2、不支持生成多条结果。
大模型
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI文字识别神器!
6.
训
练
定制:PaddleOCR支持用户根
据
自己的需求进行模型
训
练
和定制,满足特定场景下的OCR需求。
PaddleOCR
文字识别
<
...
22
23
24
25
26
27
28
29
30
31
...
>
1
2
4
5
6
7
8
9
100