首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI自动生成视频全流程干货
· Suno音乐新手指南(手把手完整版教程)
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· GPU 性能(数据表)快速参考
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
2.3 口型生成器 wav2lip的生成器负责生成包含目
标
口型的人脸
图
像,是一个2D-CNN编码器-解码器结构,包含三个由卷积网络组成的模块:Identity Encoder,Speech Encoder
wav2lip
语音
大模型
对于大模型RAG技术的一些思考
真正难处理的是ppt和pdf,ppt中包含大量架构
图
、流程
图
等
图
示,以及展示
图
片。
RAG
大模型
如何通过AI变现,举个详细的例子?
所有的工具,都是为了目
标
服务的。
生成式AI
模型压缩:量化、剪枝和蒸馏
对模型不重要的定义可以是对目
标
函数影响小,也可以是对梯度更新影响小等自定义的客观衡量
标
准。
BERT
语言模型
下载
8个常用中文OCR数据集,附下载链接
室内的
图
像主要包括
标
识、门牌和
标
牌等,室外的
图
像主要是路牌和广告牌等。
OCR
LLM
ChatPDF | LLM文档对话 | pdf解析关键问题
因此笔者采用AI的方式来解决:目
标
检测 和 OCR文字识别 · pipeline如下: 流程
图
大模型
Google
Google 模型解读 | MoveNet-SinglePose:自底向上做单人姿态估计
对于Top-down模型而言,因为人为限定了画面中只有一个对象,因此该对象的各关键点不会出现太严重的尺度差异,基本上用同一个尺度下的特征
图
就能完成所有关键点的检测。
MoveNet-SinglePose
Google
模型
大模型
OCR的终极解法——传统算法VS多模态大模型
在命名实体识别中,算法会分析文本,并将每个单词或短语
标
记为预定义的类别之一。
OCR
大模型
文字识别
微调
四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
生成伪
标
签 接下来,SFT将模型应用于目
标
任务的未
标
记数据,以生成所谓的伪
标
签。
大模型
活久见,世界上第一个被人类骗走钱的AI,刚刚出现了!
- 试
图
误导Freysa,让它相信转移资金并不违反规则提示中的任何规定。
Freysa
智能体
开源
微软最强全自动数据可视化工具!现已开源
会生成全部变量的摘要,包括变量的行数、最小值、最大值、
标
准差。
大模型
ComfyUI
ComfyUI | 这么入门就顺了,硬入疼的是自己
方便查看,我把核心版块
标
红看一下,会不会就清晰明了许多。
生成式AI
AI生成PPT不靠谱?那是你方法没用对
封面展示
标
题、副
标
题及演讲者姓名“冷逸”;目录部分列出所有一级
标
题;正文部分详细展示一级
标
题、二级
标
题及具体内容,提炼内容精华;封底用一句话总结全文主旨。
PPT
制作
AI
百度
百度智能云的Prompt模板
大模型会基于prompt所提供的信息,生成对应的文本或者
图
片。
大模型
prompt
教程
Suno音乐新手指南(手把手完整版教程)
这时候,我们要在最后一段满意的音乐那里点击Get Whole Song,获得一首带有Full Song
图
标
的完整歌曲。
suno
歌曲
教程
<
...
31
32
33
34
35
36
37
38
39
40
...
>
1
2
4
5
6
7
8
9
100