首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· ChatGLM智谱清言
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Suno歌曲制作
· 从零开始学习大模型-第一章-大模型简介
· 大模型时代 AI 技术在金融行业的创新应用
· SD入门教程二:文生图基础用法(提示词)
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 爆肝7天!AI艺术字终极攻略,光影、隐藏、嵌入、海报4种艺术字全拆解
· 【工具书】文生图常用的正向反向提示词以及常用词中英文对照表
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
SD 美颜修图神器
本文介绍了SD的美颜修图插件BMAB,可通过网址安装并用于调整生成的图片效果,如美颜、对比度、亮度、锐化、颜色、色温及噪点等。此外,该插件还能调整人物在画面中的位置和比例,提供了多种选项和参数设置,使图片更加生动和个性化。感兴趣的用户可查阅官方教程了解更多功能。
SD
文生图
2024-07-10
2024-07-10
视频
国产视频制作之光-可灵:提示词大全整理
国产视频制作正蓬勃发展,而可灵无疑是其中的闪耀之光!我们为您精心整理了一份提示词大全,堪称国产视频制作的宝藏秘籍。在这个大全里,您能找到各类丰富、实用且极具创意的提示词,无论您想要制作何种风格、何种主题的视频,它都能为您提供灵感指引。可灵的这份提示词大全,将助您在国产视频制作的道路上更加轻松顺畅,让您的创作之旅充满惊喜与可能!
可灵
kling
视频
2024-07-09
2024-07-09
ComfyUI
教会AI画汉字(ComfyUI篇)
文章介绍了如何使用ControlNet模型(一款基于qrcode的图图融合模型)和ComfyUI插件,通过详细步骤创建工作流并生成AI与文字相结合的图片效果。提供了模型下载链接和使用教程,展示了最终生成的效果图。
comfyui
文生图
2024-07-09
2024-07-09
ChatGPT
用上这10条神指令(prompt),让ChatGPT快速写出优质高分科研论文
本文提供了十个高效利用ChatGPT辅助科研论文写作的提示词指令,涵盖研究方向、总结要点、提出研究问题、选择研究方法、寻找数据源、起草大纲、提高文本可读性、解释审稿人反馈、撰写摘要及推广论文等方面,旨在提高研究论文的质量和影响力。
prompt
ChatGPT
写作
2024-07-09
2024-07-09
开源
7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
RAGFlow是一个基于深度文档理解的开源RAG(检索增强生成)引擎,旨在通过整合检索到的信息和大型语言模型(LLM)来提升回答的质量和准确性。它支持多种文件类型,具有智能解析、可视化处理和可解释性等特点,允许用户轻松上传、管理和查询文档。RAGFlow不仅提高了知识库RAG的召回率,还提供了易于集成的API,适用于各类企业系统。此外,RAGFlow持续更新,集成新的模型和功能,以满足不同需求。部署RAGFlow需要一定的系统配置,包括Docker和适当的硬件资源。
OCR
RAG
开源
2024-07-09
2024-07-09
开源
6个最佳开源TTS引擎
本文总结了多个优秀的开源文本到语音(TTS)引擎,这些引擎基于深度学习或传统技术,支持多种语言,包括中文。文章列举的引擎如CoQuiTTS、mozillaTTS、OpenTTS、MaryTTS、eSpeak、Mimic、CMU Flite TTS、MBROLA、mandarin-tts、FCH-TTS和rhasspypiper等,各自具有独特的功能和优势,适用于不同的应用场景,如帮助视觉障碍者理解文本、在车辆中播报文本信息、模拟人声、虚拟主播和歌手等。这些开源项目有助于提升TTS技术的发展和应用。
TTS引擎
开源模型
2024-07-09
2024-07-09
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
ChatTTS 文本转语音项目在github爆火出圈,引来大家极大的关注。短短2周左右的时间,在 GitHub 上已经斩获了23.5k的Star量。本文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
chattts
tts
文生语音
2024-06-21
2024-06-21
ComfyUI
使用python调用comfyui-api,实现出图自由
本文介绍了如何使用Python调用ComfyUI-API,实现自动化出图功能。首先,需要在ComfyUI中设置相应的端口并开启开发者模式,保存并验证API格式的工作流。接着,在Python脚本中,通过导入必要的库,定义一系列函数,包括显示GIF图片、向服务器队列发送提示信息、获取图片和历史记录等。通过解析工作流并获取图片,可以生成并显示所需的图像。最后,通过读取CSV文件中的提示词列表,循环调用生成图像的函数,实现批量处理。文章还提供了参考来源链接。
comfyui
工作流
2024-06-21
2024-06-21
Sora
快手版Sora「可灵」开放测试:生成超120s视频,更懂物理,复杂运动也能精准建模
「可灵」全新国产视频生成大模型开始内测了。它采用了Sora相似的技术路线,结合多项自研技术创新,生成的视频不仅运动幅度大且合理,还能模拟物理世界特性,具备强大的概念组合能力和想象力。主打一个务实,不开空头支票、发布即上线,可灵大模型已在快影APP中正式开启邀测。
可灵
快手
文生视频
2024-06-09
2024-06-09
开源
开源新标杆,千问Qwen2系列模型发布,全面超越LLama3
Qwen2系列模型开源,包含五个尺寸,支持27种语言,性能优异。模型使用GQA,实现推理加速和显存降低。在基准测试中超越当前领先模型。支持多种框架,可微调、量化、部署和二次开发。Qwen团队将继续探索更大模型和多模态模型。无资源部署者可体验大模型竞技场中的Qwen2-72B-instruct。
qwen
千问
开源
2024-06-07
2024-06-07
开源
GLM4 开源了!!!还有多模态
智谱AI开源了GLM-4-9B预训练模型,该模型在语义理解、数学推理、代码执行等领域表现卓越,支持多轮对话、网页浏览、代码执行等功能,同时增加了对26种语言的支持。基于GLM-4-9B的多模态模型GLM-4V-9B表现突出。GLM-4-9B系列模型在多个评测任务中均展现卓越性能,可快速调用体验。这一开源举措将为AI社区带来新活力和创新动力。
智普
ChatGLM
多模态
2024-06-05
2024-06-05
开源
SD3 正式开源 Sora同源架构
本文介绍了stability_ai发布的最新模型Stablediffusion3,该模型与OpenAI的Sora在架构上相似,都采用了Diffusion Transformer方式。Stablediffusion3具有生成视频、3D内容的能力,模型参数量增加至8亿,提升了图像质量。同时,介绍了即将推出的SD3 Medium模型,具有照片级真实感、优秀的字体排印学表现、高效性能以及微调能力,适用于定制和创意工作。
SD3
绘画
2024-06-03
2024-06-03
开源
有感情的语音合成开源模型:ChatTTS安装使用详解
ChatTTS是专为对话场景设计的语音生成模型,支持中英文,效果出色。它可集成于大型语言模型助手,提供自然流畅的交互体验。用户可简单提供文本获取语音文件。项目提供安装指南,包括下载源码、安装依赖、编写执行代码、自动下载模型及通过webui运行等步骤。用户可通过界面添加笑声和停顿,提升语音效果。
ChatTTS
语音合成
2024-05-30
2024-05-30
大模型
从零开始学习大模型-第一章-大模型简介
大模型是人工智能领域拥有大量参数的深度学习模型,通过学习大规模数据,能处理复杂任务。大模型具有高性能、泛化能力和多功能性,广泛应用于自然语言处理、图像识别等领域。其兴起得益于数据量的增加、计算能力的提升和算法的改进。初学者需掌握基础知识、大模型原理、工具和框架,通过实践项目、参与社区和持续学习提升能力。大模型的微调是将预训练模型适配到特定任务的关键过程,需注意学习率选择、冻结层和数据不平衡等问题。
大模型
从零开始
2024-05-24
2024-05-24
动作识别模型有哪些
动作识别模型主要包括TWO-STREAM CNN、TSN、C3D、RNN等。TWO-STREAM CNN由处理RGB图像和光流图像的两个部分构成,并联合训练。TSN是TWO-STREAM的改进版,通过将视频分段并随机选取片段进行训练,解决了TWO-STREAM不能对长时间视频建模的问题。C3D则使用三维卷积核处理视频,虽效果略低但训练速度快且网络结构简洁。RNN因能处理序列问题而被用于动作识别,相关研究工作提出了结合姿态注意力的RNN模型。此外,还有TRN、TSM和SlowFast等模型,它们分别对TSN的融合方式、2D网络的时序建模以及不同时间频率的语义捕获进行了改进和优化。
动作识别
模型
2024-05-24
2024-05-24
<
...
13
14
15
16
17
18
19
20
21
22
...
>
1
2
4
5
6
7
8
9
100