首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
训练魔法
工具
全球六大主流自动PPT制作工具
本文介绍了全球流行的AI做PPT工具,包括Decktopus、Gamma、Beautiful.ai、MindShow、Powerpresent.ai和Tome。这些工具可以自动或辅助生成PPT,提高效率,注重美观和实用性,适合不同需求的用户。用户可以根据个人喜好和需求选择合适的工具来制作演示文稿。
自动PPT
工具
2024-04-30
2024-04-30
提示词
零门槛的 4 大 AI 提示词法则,让你的 AI 助手秒变效率神器
本文介绍了如何使用AI提示词来更有效地与AI助手交流,解决AI使用不顺畅和个性化需求难以满足的问题。文章提供了四大基本法则来构建优质的AI提示词,包括给AI分配“岗位”和“待办事项”、拒绝笼统、提供示例和让AI用对“语气”。这些法则能帮助用户更好地指导AI完成任务,并输出符合期望的内容。此外,文章还提供了小技巧和建议,如如何与AI交流以获取提示词建议,以及推荐了一些免费的优质教程供深入学习。
提示词
大模型
2024-04-30
2024-04-30
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
Sora,一款由 OpenAI 在 2024 年 2 月推出的创新性文转视频生成式 AI 模型,能够依据文字说明,创作出既真实又富有想象力的场景视频,展现了其在模拟现实世界方面的巨大潜能。本文基于公开技术文档和逆向工程分析,全面审视了 Sora 背后的技术背景、应用场景、当前面临的挑战以及文转视频 AI 技术的未来发展方向。文章首先回顾了 Sora 的开发历程,探索了支撑这一“数字世界构建者”的关键技术。接着,我们详细探讨了 Sora 在电影制作、教育、市场营销等多个领域内的应用潜力及其可能带来的影响。文章还深入讨论了为实现 Sora 的广泛应用需克服的主要挑战,例如保证视频生成的安全性和公正性。最后,我们展望了 Sora 乃至整个视频生成模型技术未来的发展趋势,以及这些技术进步如何开创人机互动的新方式,进而提升视频创作的效率和创新性。
Sora
微软
2024-04-30
2024-04-30
提示词
震撼!AI语言模型突破瓶颈,26个提示词原则引领GPT-4响应质量飙升57.7%!你的模型还在等什么?
本文探讨了大型语言模型(LLMs)如GPT-4在自然语言处理领域的强大能力,并强调了优化提示词对于提高模型响应质量和准确性的重要性。文章介绍了26个优化提示原则,包括提示结构与清晰度、具体性与信息、用户交互与参与、内容与语言风格以及复杂任务与编码提示等方面。这些原则旨在帮助用户更有效地与LLMs进行交互,提升模型的输出效果。实验验证显示,仅通过优化提示词,就能显著提高模型的响应质量和准确性,尤其是在大型模型上效果更为显著。文章最后提到,这些原则就像是给LLMs装上了翅膀,让它们在AI的天空中飞得更高、更远。
语言模型
提示词
GPT-4
2024-04-30
2024-04-30
大模型
大模型套壳祛魅:质疑套壳,理解套壳
本文讨论了大模型套壳的问题,指出套壳一词在行业内存在不同的理解。文章从大模型的训练过程入手,分析了模型架构、预训练、微调等阶段中可能存在的套壳场景,并强调了在不同场景中,套壳行为应被视为正常的商业行为。同时,文章也指出了套壳行为可能带来的问题,如缺乏核心竞争力、数据隐私等。因此,文章呼吁行业应更加理性客观地看待套壳问题,把焦点放在如何降低成本、提高模型性能等关键问题上,以推动大模型应用的发展。
大模型
套壳
2024-04-30
2024-04-30
数字人
Threejs: 数字人生成金色动态粒子效果
本文介绍了生成金色动态粒子人的代码,包括顶点着色器和片元着色器的代码,这些代码可以模拟亚运会的数字人效果。动画功能使用了gsap的插件,粒子效果主要用的是glsl代码。文章提供了源码地址,并出自微信公众号。
Threejs
数字人
2024-04-29
2024-04-29
开源
来个优秀的开源人脸识别项目!
本文介绍了生物识别技术,包括指纹识别、虹膜识别、声音识别、掌纹识别、静脉识别以及人脸识别等多种技术,这些技术利用人体自身特征进行身份认证。同时,文章还介绍了一个开源的人脸识别项目——InsightFace,它基于PyTorch和MXNet,支持2D和3D人脸识别,以及人脸关键点检测等功能,是一个强大的人脸识别分析工具,适用于人脸识别研究、人脸姿态估计、动画生成等领域。
人脸识别
开源项目
2024-04-29
2024-04-29
利用AI技术自动化爬取网页数据的利器——MLScraper
MLScraper是一个强大的Python库,利用机器学习和自然语言处理技术自动解析和提取网页数据。它支持各种网页类型,并提供灵活的选择器来定位和提取数据。MLScraper还具备智能识别能力和高效性能,适用于数据采集、价格比较、舆情分析和学术研究等领域。尽管在处理复杂和动态网页时可能需要额外配置,但总体上,它是一个值得推荐的网页数据提取工具。
MLScraper
Python库
2024-04-29
2024-04-29
RAG
RAG与Long-Context之争—没必要争
文章讨论了RAG与Long-Context在大模型应用中的不同角色和争议。RAG被视为粗排,通过检索系统从数据库/知识库中找到相关片段内容,再利用大模型查找或总结出答案。Long-Context则是精排,将所有文本内容输入大模型,用户提问后,大模型直接查找或总结答案。文章指出,两者的本质区别在于外部知识如何给到大模型,以及给多少。虽然Long-Context随着模型支持长度增加可能降低检索的重要性,但由于大模型处理长度增加会导致KV Cache资源占用剧增,因此RAG仍有其存在价值。文章还探讨了Long-Context对RAG场景的影响,以及部署大模型服务的挑战和成本问题。最后强调,在技术发展中,Long-Context和RAG都是为了让大模型找到更好的答案,而真正的智能还需依赖模型本身。
RAG
Long-Context
大模型
2024-04-29
2024-04-29
数字人
最强开源数字人对口型系统介绍
本文介绍了开源的数字人克隆方法Easy-Wav2Lip,无需额外训练即可实现高清口型同步。相比其他开源方法,该方法具有更高的清晰度和更快的推理速度。提供了三种推理模型:原始模型、改进模型和增强模型。虽然增强模型推理速度较慢,但在非实时场景下仍具有应用价值。此外,文章还提供了一个在线服务网站,方便用户体验该代码。使用要求包括声音时长与视频时长等长、视频分辨率不超过1080P、帧率不超过30、音频为单人声、噪音降到最低、视频为单人露面视频且脸部清晰。
数字人
开源模型
2024-04-29
2024-04-29
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上!
在2024年的GTC大会上,英伟达发布了新型GPU架构Blackwell和B200 GPU,该GPU的理论AI性能可达20PFLOPS,是前一代H100的五倍,晶体管规模也高达2080亿。不同于以往通过先进制程提升性能的方法,B200通过物理上将两块芯片“粘合”成一个更大的芯片来实现性能的提升。这种方案在物理学边缘进行了大胆的冲锋与冒险,虽然面临技术挑战和成本问题,但为芯片行业带来了新的思考方向。英伟达通过合作和技术研发,成功实现了这一创新,为未来的计算性能提升提供了新的路径。同时,文章也回顾了芯片封装技术的发展历程,以及苹果、台积电等公司在这一领域的探索和实践。最终,这种创新的封装技术为整个行业带来了新的机遇和挑战,推动了科技革命的进程。
芯片拼接技术
2024-04-29
2024-04-29
RAG
如何提高RAG 的效果
本文探讨了如何提高RAG(Retrieval-Augmented Generation)的效果,包括参考信息主题的唯一性、预设多个Prompt模板、query改写、多种检索方式以及rerank等策略。文章强调了落地过程中细节问题的重要性,并提供了一些实践经验和解决方案。这些方法旨在帮助模型更好地利用参考信息,提高生成质量。
RAG
大模型
2024-04-28
2024-04-28
大模型
大模型在金融行业的应用场景
本文概述了大模型在金融行业中的应用场景,包括知识库/知识问答、智能客服、运营助手、风控、催收、信用评估、反欺诈、智能投顾、研发辅助和HR等。文章通过国内外实例展示了这些应用场景的具体应用和效果,如农业银行推出的ChatABC、摩根士丹利的知识问答系统、工商银行的智能客服等。这些应用不仅提高了金融业务的效率和准确性,还为客户提供了更个性化的服务。
大模型
金融
应用
2024-04-28
2024-04-28
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
本文介绍了OpenAI的Whisper的近乎实时实现项目——WhisperLive。该项目是一个实时转录应用程序,可以将语音输入转换为文本输出,支持实时音频输入和预录制的音频文件。WhisperLive使用语音活动检测(VAD)技术,仅在检测到语音时才发送音频数据,提高了转录输出的准确性和效率。用户可以通过安装PyAudio和ffmpeg,运行转录服务器和客户端程序,使用Whisper模型进行实时转录。此外,WhisperLive还支持多语言转录和翻译功能,用户可以通过设置选项来指定目标语言和任务。项目链接为https://github.com/collabora/WhisperLive。
OpenAI
Whisper
大模型
2024-04-28
2024-04-28
Stable Diffusion
Stable Diffusion插件:提示词
本文介绍了两个Stable Diffusion WebUI的提示词插件:sd-webui-prompt-all-in-one和SDWebUI Tag Autocomplete。前者提供书写提示词的辅助功能,如自动翻译和预置关键词;后者则具有自动完成提示词的能力,并支持翻译功能。文章还详细说明了这两个插件的安装和使用方法。
Stable
Diffusion
提示词
2024-04-28
2024-04-28
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100