首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 绝对是你的下载神器!AixDownloader可让你从任何网页下载你想要的内容,音乐、视频、图像、文件等!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 论文润色 | GPT4.0论文润色指令总结(含GPT3.5和4.0润色效果对比)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 用so-vits-svc-4.1进行音色转换的极简教程!
· 造梦师手记:C站最受欢迎的大模型推出了SFW版
· 秘塔AI搜索
· AI自动生成视频全流程干货
· Suno音乐新手指南(手把手完整版教程)
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型套壳祛魅:质疑套壳,理解套壳
本文讨论了大模型套壳的问题,指出套壳一词在行业内存在不同的理解。文章从大模型的训练过程入手,分析了模型架构、预训练、微调等阶段中可能存在的套壳场景,并强调了在不同场景中,套壳行为应被视为正常的商业行为。同时,文章也指出了套壳行为可能带来的问题,如缺乏核心竞争力、数据隐私等。因此,文章呼吁行业应更加理性客观地看待套壳问题,把焦点放在如何降低成本、提高模型性能等关键问题上,以推动大模型应用的发展。
大模型
套壳
2024-04-30
2024-04-30
数字人
Threejs: 数字人生成金色动态粒子效果
本文介绍了生成金色动态粒子人的代码,包括顶点着色器和片元着色器的代码,这些代码可以模拟亚运会的数字人效果。动画功能使用了gsap的插件,粒子效果主要用的是glsl代码。文章提供了源码地址,并出自微信公众号。
Threejs
数字人
2024-04-29
2024-04-29
开源
来个优秀的开源人脸识别项目!
本文介绍了生物识别技术,包括指纹识别、虹膜识别、声音识别、掌纹识别、静脉识别以及人脸识别等多种技术,这些技术利用人体自身特征进行身份认证。同时,文章还介绍了一个开源的人脸识别项目——InsightFace,它基于PyTorch和MXNet,支持2D和3D人脸识别,以及人脸关键点检测等功能,是一个强大的人脸识别分析工具,适用于人脸识别研究、人脸姿态估计、动画生成等领域。
人脸识别
开源项目
2024-04-29
2024-04-29
利用AI技术自动化爬取网页数据的利器——MLScraper
MLScraper是一个强大的Python库,利用机器学习和自然语言处理技术自动解析和提取网页数据。它支持各种网页类型,并提供灵活的选择器来定位和提取数据。MLScraper还具备智能识别能力和高效性能,适用于数据采集、价格比较、舆情分析和学术研究等领域。尽管在处理复杂和动态网页时可能需要额外配置,但总体上,它是一个值得推荐的网页数据提取工具。
MLScraper
Python库
2024-04-29
2024-04-29
RAG
RAG与Long-Context之争—没必要争
文章讨论了RAG与Long-Context在大模型应用中的不同角色和争议。RAG被视为粗排,通过检索系统从数据库/知识库中找到相关片段内容,再利用大模型查找或总结出答案。Long-Context则是精排,将所有文本内容输入大模型,用户提问后,大模型直接查找或总结答案。文章指出,两者的本质区别在于外部知识如何给到大模型,以及给多少。虽然Long-Context随着模型支持长度增加可能降低检索的重要性,但由于大模型处理长度增加会导致KV Cache资源占用剧增,因此RAG仍有其存在价值。文章还探讨了Long-Context对RAG场景的影响,以及部署大模型服务的挑战和成本问题。最后强调,在技术发展中,Long-Context和RAG都是为了让大模型找到更好的答案,而真正的智能还需依赖模型本身。
RAG
Long-Context
大模型
2024-04-29
2024-04-29
Prompt
写不好Prompt?可以先写个粗糙版本,然后让GPT帮助优化。
本文介绍了如何优化Prompt以更好地与ChatGPT互动。首先,文章通过一个粗糙版本的Prompt示例展示了如何开始这一过程。接着,文章介绍了如何通过明确目标和可用资源来继续优化Prompt,使其更加具体和有效。此外,文章还提到了让GPT4向用户提问的方法,以进一步完善Prompt。最后,文章总结了有效Prompt编写的重要性,并鼓励读者通过实践来掌握和精进这项技能。
Prompt
GPT
2024-04-29
2024-04-29
数字人
最强开源数字人对口型系统介绍
本文介绍了开源的数字人克隆方法Easy-Wav2Lip,无需额外训练即可实现高清口型同步。相比其他开源方法,该方法具有更高的清晰度和更快的推理速度。提供了三种推理模型:原始模型、改进模型和增强模型。虽然增强模型推理速度较慢,但在非实时场景下仍具有应用价值。此外,文章还提供了一个在线服务网站,方便用户体验该代码。使用要求包括声音时长与视频时长等长、视频分辨率不超过1080P、帧率不超过30、音频为单人声、噪音降到最低、视频为单人露面视频且脸部清晰。
数字人
开源模型
2024-04-29
2024-04-29
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上!
在2024年的GTC大会上,英伟达发布了新型GPU架构Blackwell和B200 GPU,该GPU的理论AI性能可达20PFLOPS,是前一代H100的五倍,晶体管规模也高达2080亿。不同于以往通过先进制程提升性能的方法,B200通过物理上将两块芯片“粘合”成一个更大的芯片来实现性能的提升。这种方案在物理学边缘进行了大胆的冲锋与冒险,虽然面临技术挑战和成本问题,但为芯片行业带来了新的思考方向。英伟达通过合作和技术研发,成功实现了这一创新,为未来的计算性能提升提供了新的路径。同时,文章也回顾了芯片封装技术的发展历程,以及苹果、台积电等公司在这一领域的探索和实践。最终,这种创新的封装技术为整个行业带来了新的机遇和挑战,推动了科技革命的进程。
芯片拼接技术
2024-04-29
2024-04-29
Stable Diffusion
Stable Diffusion高精度换脸
本文介绍了使用Stable Diffusion进行高精度换脸的操作流程,包括初版换脸、精修和高精度处理三个步骤,涉及参数设置、模型选择等,并强调了面部修复的重要性。文章还提供了具体的操作步骤和示例,展示了如何通过调整参数和模型实现高精度换脸。
Stable
Diffusion
文生图
2024-04-29
2024-04-29
ChatGPT
如何使用ChatGPT进行写作
本文介绍了如何使用ChatGPT进行内容创作,并提供了七个步骤来优化和训练ChatGPT以符合个人写作风格和需求。通过明确指导、提供示例和反馈,可以使ChatGPT产生高质量、个性化的内容。
ChatGPT
写作
2024-04-28
2024-04-28
RAG
如何提高RAG 的效果
本文探讨了如何提高RAG(Retrieval-Augmented Generation)的效果,包括参考信息主题的唯一性、预设多个Prompt模板、query改写、多种检索方式以及rerank等策略。文章强调了落地过程中细节问题的重要性,并提供了一些实践经验和解决方案。这些方法旨在帮助模型更好地利用参考信息,提高生成质量。
RAG
大模型
2024-04-28
2024-04-28
大模型
大模型在金融行业的应用场景
本文概述了大模型在金融行业中的应用场景,包括知识库/知识问答、智能客服、运营助手、风控、催收、信用评估、反欺诈、智能投顾、研发辅助和HR等。文章通过国内外实例展示了这些应用场景的具体应用和效果,如农业银行推出的ChatABC、摩根士丹利的知识问答系统、工商银行的智能客服等。这些应用不仅提高了金融业务的效率和准确性,还为客户提供了更个性化的服务。
大模型
金融
应用
2024-04-28
2024-04-28
将这些“阴谋诡计”喂给AI,使AI一天写一篇短篇小说
文章探讨了小说世界中的权谋策略,包括离间计、谋名诱敌、藏龙之际等十三种策略,旨在启迪思考并引导人们在生活中运用谋略之精华。这些策略不仅体现了智者的智慧,也考验了运用者的演技和策略布局能力。通过理解这些策略,人们可以更好地应对复杂的人际关系和竞争环境,从而在生活的棋局中更加从容地行走。文章鼓励人们与AI携手共创美好明天。
AI
写作
2024-04-28
2024-04-28
Stable Diffusion
Stable Diffusion真实人物转卡通证件照(2.0版)
本文介绍了如何使用Stable Diffusion中的dreamshaper_7模型和卡通证件照_v2.0模型,结合ControlNet插件,将真实人物照片转化为卡通证件照头像。通过三个实操案例,详细展示了所需模型和参数配置,如正向和反向提示词、迭代步数、采样方法等。
Stable
Diffusion
文生图
2024-04-28
2024-04-28
VividTalk:用一张照片和一段音频让人物栩栩如生地说话
VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的前沿技术,能将单张照片和音频结合生成逼真的讲话视频。该技术通过音频到3D网格的映射和网格到视频的转换,实现了高质量的视觉效果和真实感。VividTalk在数字媒体制作、虚拟现实和人工智能等领域有广阔应用前景,为创造更丰富和互动的数字体验提供了新可能。
VividTalk
视频
2024-04-28
2024-04-28
<
...
21
22
23
24
25
26
27
28
29
30
...
>
1
2
4
5
6
7
8
9
100