首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 为你推荐开源项目:Meridian——专属个人情报站!
· 国内厂商语音识别与Whisper评测:现状与概况对比
· 【ComfyUI】爽玩必备,6大插件汇总推荐 !
· 大模型应用的10种架构模式
· 变天了,AI可以一键生成中文海报了......
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 17K star!30秒偷走你的声音,开源声音克隆工具
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源免费离线语音
识
别
神器whisper如何安装
当然,我们知道一些商业公司提供语音
识
别
服务,但是基本都是联网运行,个人隐私安全总是有隐患,而whisper完全不同,whisper完全在本地运行,无需联网,充分保障了个人隐私,且whisper
识
别
准确率相当高
wisper
翻译
免费
OCR
14.6K star!最好用的OCR文字
识
别
项目,没有之一!
伙伴们,平时都会用到文字
识
别
吧?
Umi-OCR
开源项目
文字识别
开源
几款开源的OCR
识
别
项目,收藏备用
github.com/PaddlePaddle/PaddleOCR.git EasyOCR EasyOCR是用Python编写基于Tesseract的OCR
识
别
库
OCR
一文彻底搞懂多模
态
- 多模
态
推理
多模
态
推理 多模
态
推理涉及至少两种不同的感知模
态
,最常见的是视觉和语言。
多模态推理
大模型
工具
OCRmyPDF—可智能
识
别
PDF文本和图片信息的工具
如果需要,可以在执行OCR之前对图像进行纠偏和/或清洁 •验证输入和输出文件 •在所有可用的CPU核心之间分配工作 •使用Tesseract OCR引擎
识
别
超过
OCRmyPDF
工具
Google
AI“同声传译”新进展!Google发布,无监督,语音
识
别
:Translatotron 3!
语音
识
别
(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音
识
别
技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音
识
别
数倍加速
Whisper 是 OpenAI 研发并开源的一个自动语音
识
别
(ASR,Automatic Speech Recognition)模型,他们通过从网络上收集了 68 万小时的多语言(
语音
HeyGen
语音
语音
识
别
的未来已来:深入了解faster-whisper的突破性进展
这种实现不仅提高了语音
识
别
的速度,还优化了内存使用效率。
语音识别
Faster-Whisper
开源
OCR是什么以及推荐几款开源中文OCR
识
别
软件
光学字符
识
别
(Optical Character Recognition, OCR)是指对文本资料的图像文件进行分析
识
别
处理,获取文字及版面信息的过程。
OCR
语音
「语音
识
别
的未来已来」——探索Distil-Whisper,轻量级AI的强大力量
在AI技术的浪潮中,一款新型的语音
识
别
模型Distil-Whisper以其独特的魅力和强大的性能脱颖而出。
Distil-Whisper
语音识别
语音
国内厂商语音
识
别
与Whisper评测:现状与概况对比
同时,Whisper(飞思卡尔语音
识
别
技术)作为一项国际上也备受关注的语音
识
别
技术,在语音
识
别
领域也有着广泛的应用。
语音识别
Faster-Whisper
OCR
Windrecorder:连续记录屏幕内容,通过OCR技术
识
别
记录内容
它的所有能力(录制、
识
别
处理、存储回溯等)完全运行在本地,无需联网,不上传任何数据,只做应该做的事。
Windrecorder
录屏
语音
Whisper对于中文语音
识
别
与转写中文文本优化的实践(Python3.10)
阿里的FunAsr对Whisper中文领域的转写能力造成了一定的挑战,但实际上,Whisper的使用者完全可以针对中文的语音做一些优化的措施,换句话说,Whisper的“默认”形
态
可能在中文领域斗不过
Whisper
语音优化
探秘制作艺术二维码的新
姿
势
在之前的文章《AI制作艺术二维码-文生图》中,我介绍了一种直接通过提示词生成高逼格二维码的方法,但是通过提示词我们无法很好的控制生成图片的样式,特
别
是有些同学想要将自己的Logo或者头像附加到二维码中,
图像文字
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
在AI的众多分支中,语音
识
别
技术的突破性进展尤为引人瞩目。
Whisper
语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100