首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· SD入门教程六:ControlNet基础入门
· 大模型评测新思路:弱智吧精华问题大全
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· AI换脸工具:facefusion使用心得
· 2024年值得关注的Agent框架
· 实测:本地跑llama3:70B需要什么配置
· 万物皆可替换!阿里【ReplaceAnything】,支持在线体验!
· Coze多智能体(Multi-Agents)模式体验!
· Midjourney AI绘画美女提示词分享三
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
阿里
阿里Outfit Anyone实现真人百变换装
阿里推出AI工具Outfit Anyone,基于条件扩散模型实现超高质量虚拟试穿技术,可处理服装变形,生成逼真试穿效果,支持不同体型和姿势调节,保护用户隐私仅上传服装图片。未来与Animate Anyone结合,可打造完美网购体验,实现虚拟数字人试穿并展示动态效果。
Outfit
Anyone
阿里
2024-10-22
2024-10-22
Yi技术报告细节分享
Yi模型技术报告详解:围绕规模、数据质量设计,预训练强调数据清洗与去重,微调注重数据质量与多样化任务覆盖,采用特殊分词器、Transformer-Decoder结构并调整注意力机制等。模型扩展包括提升上下文长度和模型深度,前者通过继续预训练和微调实现,后者通过评估层间余弦相似度选择扩展层,构建Yi-9B模型。Yi模型已开源,研究扩展深度至Yi-9B的方法值得关注。
Yi模型
大模型
2024-10-22
2024-10-22
基于 Kimi Chat 的 AI 渐进式阅读法
文章介绍了一种利用AI(特别是Kimi Chat)辅助的“渐进式阅读法”,以提高处理大量文章的效率。该方法分三步:首先,AI提取文章元数据、总结并列举大纲;其次,AI详细总结内容、结论及知识点,并提出疑问;最后,根据个人需求进行个性化进阶阅读,如追问、解释专有名词等。尽管AI阅读存在局限性,如误判、幻觉及非结构化信息处理不足,但随技术进步有望改善。强调AI无法取代亲自阅读与思考的重要性。
Kimi
Chat
阅读
2024-10-21
2024-10-21
大模型
从零开始学习大模型-第二章-大模型学习路线
文章概述了学习大模型(如GPT-4、BERT)的重要性及建议路径,包括基础(数学、编程、机器学习)、深度学习必备知识、大模型入门与实践应用,以及进阶学习(模型优化、关注最新研究)和伦理安全考量。
大模型
学习
2024-10-21
2024-10-21
XX来信: 智能体设计模式2:Reflection
文章介绍了AI智能体工作流中的Reflection(反思)设计模式,强调通过多次提示LLM并让其反思输出以逐步构建高质量输出的重要性。Reflection通过自动化反馈和重写过程提升模型性能,并可通过多智能体框架或提供评估工具来增强。推荐相关论文供深入学习,并预告后续将讨论其他智能体设计模式。同时提及了新上线的JavaScript短期课程,介绍如何使用RAG构建全栈web应用程序。
Reflection
智能体
2024-10-18
2024-10-18
教程
SD入门教程六:ControlNet基础入门
文章介绍了ControlNet如何在Stable Diffusion中通过图片结构信息(如简笔画、蒙版、边缘信息)控制图片生成,比直接使用prompt效果更佳。ControlNet与Stable Diffusion结合,通过输入控制参数(如线稿图、深度图等)及辅助模型,生成更精准、具体的图片。同时,文章提供了ControlNet的安装(界面安装和GitHub安装)和使用方法,包括在文生图和图生图界面找到ControlNet操作区域,并详细说明了ControlNet的操作区域功能和参数调整。最后,文章预告了后续将介绍常用控制类型及其应用场景模板。
ControlNet
文生图
2024-10-18
2024-10-18
大模型
宁德核电推出全球参数量最大的核工业大模型|InfoQ 独家
中国广核集团福建宁德核电有限公司发布了专为核工业领域打造的大语言模型「锦书」,参数规模达720亿,旨在解决核电行业知识管理、低脑力劳动过多、安全分析能力不足等问题。该模型拥有全球最大核工业预训练语料库,开发了多项创新应用,如智能培训系统、个人岗位晋升系统等,显著提升了工作效率并降低了人力成本。项目负责人表示,「锦书」不仅推动了核电行业的数智化转型,也为AI在其他工业领域的应用提供了重要借鉴。
宁德核电
大模型
2024-10-17
2024-10-17
使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化
Dify 团队推出了包含 AI Workflow 新功能的 v0.6.0[2],这个功能虽然从去年年底就在做了,但是因为功能复杂,代码变更量巨大,直至今天 v0.6.4[3] 正式发布,才算进入一个相对稳定期,所以适合写一篇新的文章来聊聊啦。
Dify
Moonshot
API
工作流
2024-10-17
2024-10-17
开源
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
TurtleBot3是一款小型、低成本、完全可编程的移动机器人,它基于ROS(Robot Operating System)开发,并继承了TurtleBot系列的优秀特性。作为TurtleBot系列的第三代产品,TurtleBot3在二代的基础之上做了一些改进,并增加了一些新功能以满足用户的需求。 这款机器人的主要特点包括开源ROS软件、硬件开源、小尺寸、低价格、模块化驱动以及强大的扩展性。它配备了强悍的传感器,如激光雷达和摄像头,使其具有自主导航、避障、物体识别等功能。此外,TurtleBot3还支持语音识别和语音合成技术,可以与人进行自然语言交互,完成特定任务。 TurtleBot3的目标是在不牺牲功能和质量的情况下,大幅缩小平台的大小和降低价格。它提供了多种定制化的选择,包括不同的底盘、计算机和传感器,以满足用户多样化的需求。同时,它还支持搭载机械手,如OpenManipulator,以扩展其应用范围。 在教育领域,TurtleBot3可以作为一个优秀的教学平台,帮助学生更好地理解和学习机器人技术。对于研究人员来说,它可以作为一个灵活的研究工具,用于测试新的算法和技术。此外,由于其低成本和可扩展性,TurtleBot3还非常适合作为产品原型开发的平台。 总的来说,TurtleBot3是一款功能强大、灵活多变的移动机器人,适用于教育、研究、产品原型和爱好应用等多种场景。
ROS
机器人
开源模型
2024-10-16
2024-10-16
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
突出多模态能力和交互体验的 GPT-4o 强调了其在实际应用中的关键作用,然而它缺乏一个高性能的开源对应物。在本文中,作者介绍了Baichuan-Omni,这是第一款开源的 7B 多模态大语言模型(MLLM),能够同时处理和分析图像、视频、音频和文本的模态,同时提供先进的模态交互体验和强大性能。 作者提出了一种有效的多模态训练模式,从 7B 模型开始,经过两个阶段的多模态对齐和多任务微调,分别针对音频、图像、视频和文本模态。这种方法使语言模型能够有效地处理视觉和音频数据。 通过在各种全模态和多模态基准测试上展示强大的性能,作者旨在将此贡献作为开源社区在推进多模态理解和实时交互方面的竞争性 Baseline 。
Baichuan-Omni
多模态大模型
2024-10-16
2024-10-16
所有生命分子一夜皆可AI预测!AlphaFold 3改变人类对生命的理解,全球科学家都能免费使用
AlphaFold 3在Nature发表,能以前所未有的精度预测所有生命分子的结构和相互作用,包括蛋白质、DNA、RNA等,通过去噪扩散模型直接生成原子3D坐标,预测准确度大幅提升,成为全球首个超越基于真实结构预测的工具。DeepMind宣布科学家可免费使用AlphaFold 3进行非商业研究,但其商业化途径通过Isomorphic Labs进行。尽管AlphaFold 3有诸多突破,仍存在局限性和错误,但其展示了用深度学习建模复杂生命系统组件相互作用的潜力。
AlphaFold
3
蛋白
预测
2024-10-15
2024-10-15
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
上海交大开源的F5-TTS,一款基于流匹配的全非自回归文本到语音转换系统,以其高效、自然和多语言支持的优势脱颖而出,接近商用水平。其技术亮点包括全非自回归架构、流匹配技术、Diffusion Transformer应用、Sway Sampling策略、简化的训练流程及高性能多语言支持。项目链接已提供。
F5-TTS
音频克隆
2024-10-15
2024-10-15
开源
微软最新模型Phi-3 Mini开源登场!小模型,大未来!!
微软推出开源AI模型Phi-3 Mini,性能超越Llama-3 8B,擅长语言理解、逻辑推理等,且体积小、成本低,便于本地部署和运行。用户可通过LM Studio平台下载并免费使用,确保数据安全。同时提供ChatGPT 4.0和3.5的在线使用链接。
Phi-3
Mini
人工智能
2024-10-14
2024-10-14
Agent
为什么大佬都在说Agent是未来?换个角度来谈一谈
文章指出AI领域看好Agent为未来最具潜力方向,通过“旅游”需求案例说明LLM、RAG、Agent的能力边界:LLM和RAG主要生成内容,Agent则能端到端完成任务。Agent不仅生成内容,还利用工具完成用户任务,满足更完整需求。随着Agent能力提升,将打破现有平衡,带来人与机器竞争,但也孕育巨大机会,可能催生新商业模式,改变社会生活。
Agent
大模型
2024-10-14
2024-10-14
提示词
推荐一个自动生成复杂提示词的模版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
思考链(CoT)是提升大型语言模型推理能力的策略,通过分解复杂问题为简单步骤,减少错误并提高准确性。使用特定CoT提示词模版可引导AI进行多步骤推理,提高任务完成效率和准确性。Anthropic Prompt Generator也提供生成提示词的方法,但直接利用GPT生成可能效果更佳。
思考链
提示词
2024-10-11
2024-10-11
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100