首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
· 拒绝996,想出海赚美元?这7个GPT方案绝对靠谱!
· 大模型微调数据选择和构造技巧
· 深度|红杉重磅发布:2024 AI 50 榜单 (全网最全)
· 阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
· Prompt屠龙术-大厂prompt工程指南解析提炼
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
大模型
天塌了,Scaling Law 已撞收益递减墙?OpenAI 在内,所有大模型都正遭遇巨大瓶颈
OpenAI及多家前沿实验室面临人工智能大模型改进速度放缓的问题,主要原因是高质量预训练数据稀缺和硬件成本上升。为应对此困境,OpenAI等正在研究新策略,如利用合成数据训练模型。同时,麻省理工学院研究发现,大模型虽表现惊人,但对世界缺乏连贯理解,一旦环境变化可能崩溃。网友提出将LLM与逻辑引擎等结合或用人形机器人收集现实数据等建议,以推动AI技术超越当前极限。
Scaling
Law
AI大模型
2024-11-12
2024-11-12
我们需要的不是智能体,而是工作流(5000字保姆式教学)
文章总结:文章探讨了AI Agent在工作流中的应用,指出通过掌握思维技巧,如拆包大法COT(思维链方法)和多角色协作,可以打造个人高效工作流。通过实例展示了如何用COT设计生产爆文的工作流,并介绍了多角色协作在优化翻译和公众号爆文创作中的应用,强调人的能力结合AI使用技巧能放大生产力。
工作流
教学
2024-11-12
2024-11-12
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
Westlake-Omni是西湖心辰推出的全球首个开源中文情感端到端语音交互大模型,具有高质量的语音合成、精准的情感捕捉与表达、端到端设计等特点。它通过统一模态处理、深度学习基础、注意力机制等技术架构实现,经过大规模数据集训练和多种优化策略,支持情感感知与表达、多语言、个性化定制和实时交互。Westlake-Omni可应用于智能家居、智能车载、教育、医疗保健和娱乐产业等领域,为中文语音交互技术带来新活力和可能性。
Westlake
-
Omni
语音
2024-11-08
2024-11-08
LLM
PymuPDF4llm:PDF 提取的革命
PymuPDF4llm是一款开源、免费的PDF提取工具,专为大型语言模型(LLMs)优化,提供文本、表格、图像提取及文档结构分析功能,解决了传统PDF提取工具的诸多问题,提高了信息提取效率和准确性,为AI项目提供强有力的支持。
PymuPDF4llm
PDF
2024-11-07
2024-11-07
一文彻底搞懂多模态 - 多模态推理
本文总结了多模态推理的概念,涉及视觉和语言等至少两种感知模态的信息融合,旨在获取更全面准确的理解和知识,支持视觉问答、视觉常识推理、视觉语言导航等任务。文章进一步介绍了知识图谱推理及其方法,包括基于规则学习、路径排序、表示学习和神经网络学习。最后,文章阐述了多模态推理任务的具体应用,包括视觉问答、视觉常识推理和视觉语言导航。
多模态推理
大模型
2024-11-07
2024-11-07
大模型
AI+大模型在金融行业的应用场景
AI技术广泛赋能金融行业,包括营销、资管、风控等,提升交易效率和安全性。在银行、保险、证券行业中,AI应用各具特色,如银行的信用风险评估、保险的个性化产品和自动化理赔、证券的智能交易和智能投顾。但AI应用也面临数据偏差、隐私保护、算法透明度等风险和挑战。
AI大模型
金融
2024-11-06
2024-11-06
大模型
LLM每周速递!大模型最前沿:多模态RAG、RAG加速、大模型Agent、模型微调/对齐
本文总结了最近一周关于大模型(LLMs)的10篇最新研究进展,涉及多模态RAG、推理时对齐、多模态模型、大模型微调、大模型Agent等热门领域。具体包括:多模态RAG系统研究,旨在找到最佳配置以提升性能;推理时对齐方法,提出Speculative Rejection算法提高计算效率;新型扩散模型架构OmniGen,支持多种图像生成任务且用户友好;多模态语言模型BLIP-3-Video,有效捕捉视频帧时间信息;多语言多模态大模型Pangea,覆盖39种语言并在多文化和语言背景下表现优异;上下文Scaling Laws研究,解释了为何示例越多模型预测越准确;RAG推理加速方法Block-Attention,显著降低推理延迟和计算开销;可拓展Agent平台AgentStore,集成不同代理以自动化计算机任务;LLM PEFT技术全面介绍,提供了高效的针对预训练模型的下游任务适配手段。
大模型
研究
2024-11-04
2024-11-04
大模型
投资人逃离大模型
人工智能浪潮的掀起,世界正迎来一场前所未有的技术革命。 从20世纪50年代开始人工智能技术诞生至今,已经先后四次引起大规模的关注。而如今正处在第四次的大模型时代,前三次分别为专家系统时代、机器学习时代和深度学习时代。 后世之人如果要回顾这次的大模型时代,ChatGPT一定是一个绕不开的名字。2022年时,Open AI研发的ChatGPT-3.5横空出世,技惊四座,无论是写代码论文还是写诗作画,吹拉弹唱样样精通。
大模型
2024-11-01
2024-11-01
字节,悄咪咪做了个 Liblib
「LiblibAI」一年内完成三轮数亿元融资,成为知名AI模型社区产品。字节推出类似AI模型分享社区「炉米Lumi」,目前为白名单版本,提供模型分享、Workflow搭建等服务。字节今年已推出二十余款AI产品,内部开启新一轮赛马机制,期待「炉米Lumi」早日公测。
Lumi
大模型
2024-11-01
2024-11-01
鹅厂版AI笔记悄悄上线,微信公众号优质内容秒变专属知识库,实测在此
ima copilot是腾讯推出的AI助手,能搜索微信公众号文章并一键加入专属知识库,支持AI检索总结、笔记功能及多模态搜索。用户可建立个人知识库并利用AI扩写、润色、翻译等功能记笔记。此外,AI笔记应用正逐渐受到关注,谷歌NotebookLM和Meta的NotebookLlama等项目也在该领域展开竞争。
ima
copilot
搜索
2024-10-30
2024-10-30
独家!黄太吉创始人再创业:首次披露惨败内幕
赫畅31岁创办餐饮品牌黄太吉,利用移动互联网营销成为网红餐厅,后转型外卖平台,获1.8亿融资但终因战略失误破产。他通过研读《毛选》反思失败,并开设《毛选创业课》帮助其他创业者。同时,童话作家郑渊洁对其人生也有深刻影响,让他选择初中辍学学习技能。赫畅认为中国创业者应基于国情发展,学习《毛选》有助于找到新的理论基础。
黄太吉
创业
2024-10-29
2024-10-29
RAG
LlamaIndex的QueryPipeline在实现RAG应用后,Agent应用也可以实现了(附开发示例)
文章总结:文章介绍了LlamaIndex推出的新实验功能QueryPipeline,支持通过声明式方式定义个性化应用流程,并给出了RAG类应用及ReAct Agent的实现案例。文章以Text2SQL的ReAct Agent为例,详细阐述了构建过程,包括数据导入、安装可观测性工具、构建Text2SQL工具、构建ReAct Agent Pipeline等步骤。文章还提到,当前该特性仍处于研发预览状态,存在限制,未来有待改进以实现复杂的Agent应用模式及Agent与RAG混排。
Agent
QueryPipeline
大模型
2024-10-29
2024-10-29
了解Kimi必看的26个问题 | Kimi系列文(二)
本文是《Kimi使用,从入门到精通》系列文章的第二篇,系统介绍了Kimi这一国产文本AI助手,包括其定义、开发公司、定位、水平、用户群体、功能、与搜索引擎的区别、使用方式、费用、限制、输出内容、历史会话管理、分享功能、会话切换、常用语调用、高质量回答获取、语音支持、数据隐私、个人及企业使用建议等。
Kimi
大语言模型
2024-10-28
2024-10-28
通义千问
必看!阿里通义千问完整技术报告
大型语言模型(LLMs)已经彻底改变了人工智能领域,使得以前被认为是人类专属的自然语言处理任务成为实现可能。在这项工作中,我们介绍了QWEN,我们大型语言模型系列的第一个版本。QWEN是一个全面的语言模型系列,包括参数数量不同的不同模型。它包括QWEN,基础预训练语言模型,以及QWEN-CHAT,使用人类对齐技术微调的聊天模型。
大型语言模型
报告
2024-10-25
2024-10-25
大模型
秒懂AI-深度学习五大模型:RNN、CNN、Transformer、BERT、GPT简介
本文介绍了深度学习领域的五种常用模型:RNN、CNN、Transformer、BERT和GPT,它们在自然语言处理、计算机视觉等领域取得显著突破。RNN适合处理时间序列数据,CNN擅长图像数据,Transformer通过自注意力机制处理长序列,BERT和GPT作为预训练语言模型分别通过双向和单向Transformer编码器在NLP任务中表现出色。每种模型均有其独特的处理数据方式和应用场景,并附有经典案例。
大模型
学习
2024-10-24
2024-10-24
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100