首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· MCP服务介绍及应用场景报告-来自Manus
· 为你推荐开源项目:Meridian——专属个人情报站!
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 自己电脑上跑大语言模型(LLM)要多少内存?
· 又快又好,秒级出图的AI大模型
· GenColor.ai
· 阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Sora
OpenAI视频模型Sora的推理生成成本多高?
根据 OpenAI 的技术报告: Video generation models as world simulators ,Sora 是一个 Diffusion Model, 且
应
该使用的是
Sora
推理
算力
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
每个编码器层都有多头自注意力机制和前馈神经网络,用于
对
输入序列进行多层次的特征提取和表示学习。
Bert-vits
语音
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
动机 我在网上搜索了一个免费的命令行工具来
对
PDF文件进行OCR:我找到了很多,但没有一个真正令人满意: •要么它们生成的PDF文件中的文本放置错误(使得无法复制/粘贴)•
OCRmyPDF
工具
体验Outfit Anyone,高质量虚拟换装,效果如何?
从功能描述上看,可以快速实现虚拟换衣,在电商场景下的
应
用非常实用。
Outfit
Anyone
模拟
LLM
实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
第四步,针
对
文档的内容,提出三个用户在阅读的过程中可能会有的疑问。
Ollama
AnythingLLM
阅读
大模型
8G显存一键训练,解锁Llama2隐藏能力!XTuner带你玩转大模型
高效的数据引擎 XTuner 适配了多个热门开源数据集格式,开发者如已有
对
应
格式的数据集,可以直接使用,并支持多种格式数据源的混合使用: Alpaca
大模型
ChatGLM
基于本地知识的问答机器人langchain-ChatGLM
在实际
应
用场景中,除闲聊机器人外,大多数机器人是为了完成特定任务的。
langchain
如何使用 Megatron-LM 训练语言模型
Megatron-LM 4 是研究人员用于预训练大型 Transformer 模型的另一个流行工具,它是 NVIDIA
应
用深度学习研究团队开发的一个强大框架。
开源模型
Stable Diffusion
Stable Diffusion 入门教程开篇
通常理解就是:Stable Diffusion 是一种智能的图像生成工具,它能够根据你提供的描述文字(比如“一只蓝色的猫”)来创造出相
应
的图片。
Stable
Diffusion
文生图
入门教程
ComfyUI
ComfyUI学习笔记:插件安装
进一步丰富功能时,需要按需自主添加节点,例如加入LoRA: 也可以使用节点搜索(双击空白处): 这与webui一上来就摆好盘的软件操作思路有所不同: 所以之前有webui使用经验后,相
对
熟悉常用功能
comfyui
插件
绘画
教程
Suno音乐新手指南(手把手完整版教程)
如果你认真看了前面我写的东西,那么你生成的歌曲音乐质量
应
该不会太差。
suno
歌曲
教程
ChatGPT
ChatGPT提示工程 - 总结
策略3:让模型检查是否满足条件 策略4:少样本提示 原则二:给予模型思考的时间 策略1:明确说明完成任务所需的步骤 策略2:提示模型不要匆忙得出结论,而是要找出自己的解决方案 本篇介绍一下如何
对
内容进行总结
GPT
ComfyUI
AI绘画:两组赛博咒语和ComfyUI使用方法!
当然这两组咒语并不是仅
对
动物而已。
文生图
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
据统计,世界上有超过7000种语言,但是目前的语音识别系统只能覆盖其中的一小部分,而且
对
于一些低资源语言,由于缺乏足够的标注数据,训练高质量的语音识别模型非常困难。
Translatotron
语音识别
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
但是随着transformer模型attention注意力机制进入计算机视觉任务,我们同样可以使用transformer来进行计算机视觉方面的任务,比如
对
象检测,
对
象分类,
对
象分割等,这里毕竟著名的模型
OCR
手写
文字识别
<
...
76
77
78
79
80
81
82
83
84
85
...
>
1
2
4
5
6
7
8
9
100