首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 大模型微调方法总结
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· ComfyUI 基础教程(一)环境部署和插件安装
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 6个最佳开源TTS引擎
· Suno音乐新手指南(手把手完整版教程)
· 【一步一步引导】从零详细地梳理一个完整的 LLM 训练流程
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
教程
保姆级教程:手把手教你创建GPTs角色应用
本文介绍了GPTs技术,它是OpenAI为Plus会员提供的定制ChatGPT版本的技术。用户可以通过GPTs技术创建自己的智能助手,实现指令、知识和操作功能。文章还介绍了如何确认是否开通了GPTs技术,GPTs功能列表以及如何创建和测试优化自己的GPTs角色。GPTs技术的出现为个人开发者提供了快速创造多样小型产品的可能性,使得开发者可以将自己的应用上架并获得收益。
GPTs角色
应用创建
2024-04-10
2024-04-10
GPTs
刚上线就崩了?字节版 GPTs 征战国内市场:无需编码,快速创建 AI 聊天机器人
字节跳动旗下AI聊天机器人构建平台Coze国内版上线,提供快速创建和部署聊天机器人的工具。Coze集成了丰富插件工具和知识库,支持自定义插件和数据库记忆能力,可灵活设计工作流。平台支持无编程经验用户,可发布到飞书、微信等平台。此外,字节跳动新成立的AI部门Flow聚焦AI应用层,已推出多款AI产品,包括娱乐和工作场景的聊天机器人。Coze等产品在隐私政策中警告可能与其他“我公司内部实体”共享用户信息,但将遵守访问控制和审批流程。
字节GPTs
AI聊天机器人
2024-04-10
2024-04-10
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
本文介绍了RAG(Retrieval Augmented Generation,检索增强生成)系统,它能从知识库中检索信息以生成事实、上下文相关和特定领域的内容。文章重点讨论了RAG面临的挑战和两种先进的检索方法:从小到大的检索和句子窗口检索。前者使用较小的文本块进行检索,同时保留足够的上下文信息供大语言模型合成响应;后者则将文档解析为每个块的一个句子,并在检索时使用句子窗口提供额外的上下文。这两种方法均通过LlamaIndex实现,并提供了具体的实现步骤和示例。文章最后总结了这两种方法的应用和未来的研究方向。
LLM之RAG
小块检索
2024-04-10
2024-04-10
微调
LLM微调经验&认知
这篇文章主要讨论了大型语言模型(LLM)的认知和训练方面。在认知方面,文章指出知识主要来自预训练阶段,指令微调主要是为了让LLM更好地输出已具备的知识。同时,文章也提到了模型学会中文后能够理解和输出一些指令微调数据集里未见过的中文词汇,但指令微调并非数据量越多越好,数据质量可能更重要。在训练方面,文章介绍了Lora框架和int8推理等相关内容,并给出了一些微调时的实用建议,如prompt和output尽量不要重复等。此外,文章还提到了模型可能更容易理解“模型语言”这一玄学现象,并讨论了预训练阶段数据量和质量的优先级问题。最后,文章还提出了一些猜想和补充,如领域微调时模型参数越大可能越难训,以及chatGLM2的max_length起飞等问题。
LLM微调
经验认知
2024-04-09
2024-04-09
RAG
RAG 领域的新宠:为什么 AI 圈都在谈论 Jina ColBERT?
在 RAG (检索增强生成)领域,选对向量模型至关重要,它基本就决定了 RAG 系统的“天花板”,也因此,向量模型的选择总是业界的热门讨论话题。
rag
大模型
2024-04-09
2024-04-09
大模型
评论能力强于GPT-4,上交开源13B评估大模型Auto-J
上海交通大学生成式人工智能实验室推出了一款全新的价值对齐评估工具Auto-J,旨在解决生成式人工智能技术在与人类价值对齐方面的挑战。该工具包含130亿参数,支持50+种真实场景的用户问询评估,可无缝切换两种评估范式,并输出详细、结构化且易读的自然语言评论。性能上,Auto-J的评估效果仅次于GPT-4,且显著优于其他开源或闭源模型,同时降低了评估成本。实验证明,Auto-J在多个任务上的表现均优于基线模型。此外,研究团队还公开了Auto-J的模型、训练和测试数据、场景定义文件和参考评估标准,以及用户问询场景分类器等资源,以促进该领域的研究和发展。
Auto-J
大模型
2024-04-08
2024-04-08
大模型
国内AI大模型已近80个,哪个最有前途?
本文总结了大模型时代中几家有前途的公司,包括字节、百度、Moonshot和智谱,以及大厂和创业公司可能遇到的问题。字节有多模态中文私有数据、OpenAI研究科学家和大量GPU资源,百度有先发优势、高重视程度和丰富的文本数据积累。Moonshot团队专业且和谐,模型水平超过GPT-3.5。智谱有独特的商业模式和较大的融资额。大厂可能面临资源碎片化、部门墙厚、传统AI research taste阻碍等问题,而创业公司可能遭遇Founder dispute、患上大公司病、技术不够成熟就急于发布等问题。此外,买不到/租不到GPU和拉不到下一轮投资也是普遍的挑战。
大模型
2024-04-08
2024-04-08
微调
NEFTune:在Embedding中加入噪⾳提⾼指令微调效果!
本文介绍了NEFTune技术,即在训练过程中向嵌入向量添加均匀随机噪声,以改善大型语言模型(LLM)的微调性能。研究结果显示,使用NEFTune技术可以显著提高LLM在对话任务上的性能,同时保持对其他任务性能的稳定性。NEFTune技术是一种简单而有效的正则化方法,可以缓解模型在指令微调阶段的过拟合现象,并更好地利用预训练阶段的知识内容。虽然研究还存在一些局限性,但NEFTune的成功表明了算法和正则化对LLM训练的重要性。
NEFTune
指令微调
2024-04-08
2024-04-08
OpenAI
OpenAI 上线新功能力捧 RAG,开发者真的不需要向量数据库了?
本文探讨了OpenAI的开发者大会上推出的GPT-4 Turbo模型、全新Assistants API和一系列增强功能。其中,Assistants API的内置工具支持了代码解释器、知识库检索以及函数调用,能帮助开发者构建高质量的AI应用。然而,其内置的检索功能存在可扩展性、定制化和多租户支持等方面的限制。为了克服这些限制,文章介绍了使用Milvus向量数据库实现自定义检索功能的方法。通过集成Milvus,开发者可以构建高效、可扩展的检索器,满足多样化的用例需求。文章最后总结了OpenAI Assistants内置检索功能的局限性,并强调了使用向量数据库进行自定义检索的重要性。
OpenAI新功
RAG与向量库
2024-04-08
2024-04-08
大模型
“大模型+机器人”的现状和未来,重磅综述报告来了!
本文综述了基础模型在机器人学中的应用,包括感知、决策与规划、控制等方面。视觉Transformer和视觉-语言模型提高了机器人感知的通用性和泛化能力,大型语言模型助力决策与规划,实现了从语言到行动的映射,而扩散模型和视觉-语言模型则优化了机器人控制。基础模型为机器人注入了语言理解、视觉泛化、常识推理等能力,预示着机器人学的新发展。未来,基础模型在机器人领域的应用将更广泛,需解决实时性、鲁棒性和可解释性等问题,推动机器人技术为社会带来更大福祉。
大模型+机器人
现状与未来
2024-04-07
2024-04-07
教程
GPTs使用指南 | 保姆级GPTs入门教程,0代码基础也能做AI产品
本文介绍了如何创建自己的GPTs,包括注册ChatGPT官网、开通ChatGPT Plus服务、进入GPTs创建入口、完善GPTs配置、保存并发布GPTs等步骤。同时,还推荐了一款名为GPTs Find的产品,帮助用户快速寻找可用的GPTs,并提供了GPTs搜索、入门教程、智能问答机器人和最新信息交流社群等功能。
GPTs使用
AI产品制作
2024-04-07
2024-04-07
语音
Whisper对于中文语音识别与转写中文文本优化的实践(Python3.10)
文章主要讨论了阿里FunAsr对Whisper中文领域转写能力的挑战,并提供了通过优化措施提高Whisper在中文转写上的表现。首先,文章指出Whisper在中文语音转写后对标点符号的支持不够完备,但可以通过调整DecodingOptions中的prompt参数进行引导,改善标点符号的标注效果。其次,文章介绍了使用transformers库调用中文模型的方法,特别是BELLE-2/Belle-whisper-large-v2-zh模型,该模型在whisper的large-v2模型基础上针对中文进行了微调,提高了中文语音识别的准确度和效率。尽管该模型在标点能力方面有所弱化,但仍可通过其他方案如基于标点模型对转写文本加标点来弥补。文章还提到了small模型的中文优化版本,如Jingmiao/whisper-small-chinese_base。最后,文章总结了通过微调预训练模型,可以将其应用于特定的中文NLP任务,提高模型在该任务上的性能。
Whisper
中文语音
2024-04-07
2024-04-07
SQL
RLHF 在 Text2SQL 领域中的探索
文主要介绍了 Text2SQL 的基本概念,以及 RLHF 的概念和框架,最后结合 DB-GPT-Hub 项目,将 RLHF 方法应用于 Text2SQL 任务进行实践探索。
Text2SQL
RLHF
2024-04-07
2024-04-07
LLM
Byzer-LLM 快速体验智谱 GLM-4
本文介绍了Byzer-LLM,一个可以部署和使用市面上主流开源和SaaS版本大模型的工具。文章重点介绍了如何快速体验GLM-4模型,包括注册账号、申请API Key、部署使用等步骤。此外,文章还提到了Byzer-LLM的一些独特功能,如Function Calling、RespondWith Class和Funciton Impl,以及两套实现方式:基于Prompt改写和基于SystemMessage+Prompt改写。最后,文章对GLM-4的测试结果进行了评价,认为其表现惊艳。
Byzer-LLM
智谱GLM-4
2024-04-07
2024-04-07
大模型
开源大模型王座易主!谷歌Gemma杀入场,笔记本可跑,可商用
刚刚,谷歌杀入开源大模型。 开源领域大模型,迎来了重磅新玩家。 谷歌推出了全新的开源模型系列「Gemma」。相比 Gemini,Gemma 更加轻量,同时保持免费可用,模型权重也一并开源了,且允许商用。
开源模型
Gemma
2024-04-03
2024-04-03
<
...
17
18
19
20
21
22
23
24
25
26
...
>
1
2
4
5
6
7
8
9
100