首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· PPT又又有新突破了!智谱AI代码流造PPT
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 国产视频制作之光-可灵:提示词大全整理
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· RVC和SVC声音模型难找?推荐这个网站
· 换脸软件 FaceFusion 保姆级教程
· 傻瓜式!一键部署ChatGLM3,免去环境烦恼+开箱即用!集成API调用!本地化界面操作!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
领域大模型-训练Trick&落地思考
个人感觉
应
该跟领域数据量有关,当数据量没有那多时,一般数据比例在1:5到1:10之间是比较合适的。
垂直
训练
大模型
ComfyUI
ComfyUI学习笔记:插件安装
进一步丰富功能时,需要按需自主添加节点,例如加入LoRA: 也可以使用节点搜索(双击空白处): 这与webui一上来就摆好盘的软件操作思路有所不同: 所以之前有webui使用经验后,相
对
熟悉常用功能
comfyui
插件
绘画
Sora
OpenAI视频模型Sora的推理生成成本多高?
根据 OpenAI 的技术报告: Video generation models as world simulators ,Sora 是一个 Diffusion Model, 且
应
该使用的是
Sora
推理
算力
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
每个编码器层都有多头自注意力机制和前馈神经网络,用于
对
输入序列进行多层次的特征提取和表示学习。
Bert-vits
语音
工具
OCRmyPDF—可智能识别PDF文本和图片信息的工具
动机 我在网上搜索了一个免费的命令行工具来
对
PDF文件进行OCR:我找到了很多,但没有一个真正令人满意: •要么它们生成的PDF文件中的文本放置错误(使得无法复制/粘贴)•
OCRmyPDF
工具
ComfyUI
AI绘画:两组赛博咒语和ComfyUI使用方法!
当然这两组咒语并不是仅
对
动物而已。
文生图
教程
Suno音乐新手指南(手把手完整版教程)
如果你认真看了前面我写的东西,那么你生成的歌曲音乐质量
应
该不会太差。
suno
歌曲
教程
ChatGPT
ChatGPT提示工程 - 总结
策略3:让模型检查是否满足条件 策略4:少样本提示 原则二:给予模型思考的时间 策略1:明确说明完成任务所需的步骤 策略2:提示模型不要匆忙得出结论,而是要找出自己的解决方案 本篇介绍一下如何
对
内容进行总结
GPT
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
据统计,世界上有超过7000种语言,但是目前的语音识别系统只能覆盖其中的一小部分,而且
对
于一些低资源语言,由于缺乏足够的标注数据,训练高质量的语音识别模型非常困难。
Translatotron
语音识别
Transformer
TrOCR——基于transformer模型的OCR手写文字识别
但是随着transformer模型attention注意力机制进入计算机视觉任务,我们同样可以使用transformer来进行计算机视觉方面的任务,比如
对
象检测,
对
象分类,
对
象分割等,这里毕竟著名的模型
OCR
手写
文字识别
ChatGLM
基于本地知识的问答机器人langchain-ChatGLM
在实际
应
用场景中,除闲聊机器人外,大多数机器人是为了完成特定任务的。
langchain
开源
令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
ChartLlama是一个专门针
对
图表的多模态语言模型,它可以从图表中提取信息,也可以根据数据和要求来创建图表。
ChartLlama
开源模型
图标
Stable Diffusion
超详细的 Stable Diffusion ComfyUI 基础教程(二):文生图基础流程
这时候我们是不是发现“Checkpoint 加载器”和“CLIP 文本编码器”上面都有一个同样名称、同样颜色的黄点“CLIP”,我们把它连起来(鼠标放在上面会有“十”字标识,我们左键按住住拖到另一个节点的
对
应
位置就连上了
comfyui
文生图
LLM
自己电脑上跑大语言模型(LLM)要多少内存?
一般模型文件的实际尺寸要比简单计算的尺寸大 · · 即使是同样参数和精度的模型,实际尺寸也不一样 · · 降低模型精度的过程叫量化(Quantization),不同模型
对
降低精度的敏感程度不一样
大语言模型
运行
数字人
腾讯开源的数字人MuseTalk到底行不行?
08 还有其他的案例,我就不浪费笔墨上传了,大家感兴趣可以去这里看: https://github.com/TMElyralab/MuseTalk
对
了
MuseTalk
数字人
音频
<
...
77
78
79
80
81
82
83
84
85
86
...
>
1
2
4
5
6
7
8
9
100