首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大语言模型应用中的文本分块策略
· 开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 剪映专业版智能补帧
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· AI声音克隆 | 最全最简教程(权威版)
· Suno音乐新手指南(手把手完整版教程)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
来个优秀的开源人脸识别项目!
本文介绍了生物识别技术,包括指纹识别、虹膜识别、声音识别、掌纹识别、静脉识别以及人脸识别等多种技术,这些技术利用人体自身特征进行身份认证。同时,文章还介绍了一个开源的人脸识别项目——InsightFace,它基于PyTorch和MXNet,支持2D和3D人脸识别,以及人脸关键点检测等功能,是一个强大的人脸识别分析工具,适用于人脸识别研究、人脸姿态估计、动画生成等领域。
人脸识别
开源项目
2024-04-29
2024-04-29
利用AI技术自动化爬取网页数据的利器——MLScraper
MLScraper是一个强大的Python库,利用机器学习和自然语言处理技术自动解析和提取网页数据。它支持各种网页类型,并提供灵活的选择器来定位和提取数据。MLScraper还具备智能识别能力和高效性能,适用于数据采集、价格比较、舆情分析和学术研究等领域。尽管在处理复杂和动态网页时可能需要额外配置,但总体上,它是一个值得推荐的网页数据提取工具。
MLScraper
Python库
2024-04-29
2024-04-29
RAG
RAG与Long-Context之争—没必要争
文章讨论了RAG与Long-Context在大模型应用中的不同角色和争议。RAG被视为粗排,通过检索系统从数据库/知识库中找到相关片段内容,再利用大模型查找或总结出答案。Long-Context则是精排,将所有文本内容输入大模型,用户提问后,大模型直接查找或总结答案。文章指出,两者的本质区别在于外部知识如何给到大模型,以及给多少。虽然Long-Context随着模型支持长度增加可能降低检索的重要性,但由于大模型处理长度增加会导致KV Cache资源占用剧增,因此RAG仍有其存在价值。文章还探讨了Long-Context对RAG场景的影响,以及部署大模型服务的挑战和成本问题。最后强调,在技术发展中,Long-Context和RAG都是为了让大模型找到更好的答案,而真正的智能还需依赖模型本身。
RAG
Long-Context
大模型
2024-04-29
2024-04-29
Prompt
写不好Prompt?可以先写个粗糙版本,然后让GPT帮助优化。
本文介绍了如何优化Prompt以更好地与ChatGPT互动。首先,文章通过一个粗糙版本的Prompt示例展示了如何开始这一过程。接着,文章介绍了如何通过明确目标和可用资源来继续优化Prompt,使其更加具体和有效。此外,文章还提到了让GPT4向用户提问的方法,以进一步完善Prompt。最后,文章总结了有效Prompt编写的重要性,并鼓励读者通过实践来掌握和精进这项技能。
Prompt
GPT
2024-04-29
2024-04-29
数字人
最强开源数字人对口型系统介绍
本文介绍了开源的数字人克隆方法Easy-Wav2Lip,无需额外训练即可实现高清口型同步。相比其他开源方法,该方法具有更高的清晰度和更快的推理速度。提供了三种推理模型:原始模型、改进模型和增强模型。虽然增强模型推理速度较慢,但在非实时场景下仍具有应用价值。此外,文章还提供了一个在线服务网站,方便用户体验该代码。使用要求包括声音时长与视频时长等长、视频分辨率不超过1080P、帧率不超过30、音频为单人声、噪音降到最低、视频为单人露面视频且脸部清晰。
数字人
开源模型
2024-04-29
2024-04-29
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上!
在2024年的GTC大会上,英伟达发布了新型GPU架构Blackwell和B200 GPU,该GPU的理论AI性能可达20PFLOPS,是前一代H100的五倍,晶体管规模也高达2080亿。不同于以往通过先进制程提升性能的方法,B200通过物理上将两块芯片“粘合”成一个更大的芯片来实现性能的提升。这种方案在物理学边缘进行了大胆的冲锋与冒险,虽然面临技术挑战和成本问题,但为芯片行业带来了新的思考方向。英伟达通过合作和技术研发,成功实现了这一创新,为未来的计算性能提升提供了新的路径。同时,文章也回顾了芯片封装技术的发展历程,以及苹果、台积电等公司在这一领域的探索和实践。最终,这种创新的封装技术为整个行业带来了新的机遇和挑战,推动了科技革命的进程。
芯片拼接技术
2024-04-29
2024-04-29
Stable Diffusion
Stable Diffusion高精度换脸
本文介绍了使用Stable Diffusion进行高精度换脸的操作流程,包括初版换脸、精修和高精度处理三个步骤,涉及参数设置、模型选择等,并强调了面部修复的重要性。文章还提供了具体的操作步骤和示例,展示了如何通过调整参数和模型实现高精度换脸。
Stable
Diffusion
文生图
2024-04-29
2024-04-29
ChatGPT
如何使用ChatGPT进行写作
本文介绍了如何使用ChatGPT进行内容创作,并提供了七个步骤来优化和训练ChatGPT以符合个人写作风格和需求。通过明确指导、提供示例和反馈,可以使ChatGPT产生高质量、个性化的内容。
ChatGPT
写作
2024-04-28
2024-04-28
RAG
如何提高RAG 的效果
本文探讨了如何提高RAG(Retrieval-Augmented Generation)的效果,包括参考信息主题的唯一性、预设多个Prompt模板、query改写、多种检索方式以及rerank等策略。文章强调了落地过程中细节问题的重要性,并提供了一些实践经验和解决方案。这些方法旨在帮助模型更好地利用参考信息,提高生成质量。
RAG
大模型
2024-04-28
2024-04-28
大模型
大模型在金融行业的应用场景
本文概述了大模型在金融行业中的应用场景,包括知识库/知识问答、智能客服、运营助手、风控、催收、信用评估、反欺诈、智能投顾、研发辅助和HR等。文章通过国内外实例展示了这些应用场景的具体应用和效果,如农业银行推出的ChatABC、摩根士丹利的知识问答系统、工商银行的智能客服等。这些应用不仅提高了金融业务的效率和准确性,还为客户提供了更个性化的服务。
大模型
金融
应用
2024-04-28
2024-04-28
将这些“阴谋诡计”喂给AI,使AI一天写一篇短篇小说
文章探讨了小说世界中的权谋策略,包括离间计、谋名诱敌、藏龙之际等十三种策略,旨在启迪思考并引导人们在生活中运用谋略之精华。这些策略不仅体现了智者的智慧,也考验了运用者的演技和策略布局能力。通过理解这些策略,人们可以更好地应对复杂的人际关系和竞争环境,从而在生活的棋局中更加从容地行走。文章鼓励人们与AI携手共创美好明天。
AI
写作
2024-04-28
2024-04-28
Stable Diffusion
Stable Diffusion真实人物转卡通证件照(2.0版)
本文介绍了如何使用Stable Diffusion中的dreamshaper_7模型和卡通证件照_v2.0模型,结合ControlNet插件,将真实人物照片转化为卡通证件照头像。通过三个实操案例,详细展示了所需模型和参数配置,如正向和反向提示词、迭代步数、采样方法等。
Stable
Diffusion
文生图
2024-04-28
2024-04-28
VividTalk:用一张照片和一段音频让人物栩栩如生地说话
VividTalk是南京大学、阿里巴巴、字节跳动和南开大学联合开发的前沿技术,能将单张照片和音频结合生成逼真的讲话视频。该技术通过音频到3D网格的映射和网格到视频的转换,实现了高质量的视觉效果和真实感。VividTalk在数字媒体制作、虚拟现实和人工智能等领域有广阔应用前景,为创造更丰富和互动的数字体验提供了新可能。
VividTalk
视频
2024-04-28
2024-04-28
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
本文介绍了OpenAI的Whisper的近乎实时实现项目——WhisperLive。该项目是一个实时转录应用程序,可以将语音输入转换为文本输出,支持实时音频输入和预录制的音频文件。WhisperLive使用语音活动检测(VAD)技术,仅在检测到语音时才发送音频数据,提高了转录输出的准确性和效率。用户可以通过安装PyAudio和ffmpeg,运行转录服务器和客户端程序,使用Whisper模型进行实时转录。此外,WhisperLive还支持多语言转录和翻译功能,用户可以通过设置选项来指定目标语言和任务。项目链接为https://github.com/collabora/WhisperLive。
OpenAI
Whisper
大模型
2024-04-28
2024-04-28
Stable Diffusion
Stable Diffusion插件:提示词
本文介绍了两个Stable Diffusion WebUI的提示词插件:sd-webui-prompt-all-in-one和SDWebUI Tag Autocomplete。前者提供书写提示词的辅助功能,如自动翻译和预置关键词;后者则具有自动完成提示词的能力,并支持翻译功能。文章还详细说明了这两个插件的安装和使用方法。
Stable
Diffusion
提示词
2024-04-28
2024-04-28
<
...
21
22
23
24
25
26
27
28
29
30
...
>
1
2
4
5
6
7
8
9
100