首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 13个神级Chatgpt指令,助你小说丝滑过审
· Suno音乐新手指南(手把手完整版教程)
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 阿里云王坚:中国AI不惧R2迟发!靠「群体智能」破局:算力不是瓶颈,但AI应用层急需炸开OpenAI想象围墙!不看好硅谷抢人乱象
· 造梦师手记:C站最受欢迎的大模型推出了SFW版
· AI绘画巅峰对决:Stable Diffusion 3与DALL·E 3原理深度比较
· AI写作不如意?万字长文深度剖析背后原因
· 大模型的研究新方向:混合专家模型(MoE)
· 喂饭级 AI’MWISE 启动器安装教程
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
语音
Insanely Fast Whisper:超快的Whisper语音
识
别脚本
这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。作者提供了几种优化方式,包括批处理、半精度处理以及BetterTransformer,以提高转录速度。最终,作者以实际测试数据展示了不同优化方式的速度对比。同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。
音频
Whisper
开源
来个优秀的开源人脸
识
别项目!
虹膜
识
别技术通过全自动照相机寻找并聚焦虹膜,实现高精度
识
别。
人脸识别
开源项目
大模型
大模型外挂知
识
库优化-大模型辅助向量召回
此时的回答内容很可能是存在知
识
性错误,因为如果能回答正确,那就不需要召回补充额外知
识
了对吧。
大模型
开源
OpenAI 开源语音
识
别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动语音
识
别模型的软件工具,能够将音频或视频中的语音自动
识
别为带有时间戳的文本字幕。
生成式AI
大模型
会“追问”的Agent,大模型知
识
库另类实践
在实际的生产环境中,此类知
识
库应用可能遇到两类问题:知
识
型和政策型(图1)。
大模型
ChatGPT
爆肝两天!ChatGPT+提示词解决知
识
库目录混乱
对于职场新手可能缺乏有效的知
识
管理和分类技巧,导致知
识
库变得错综复杂。
智能分类
大模型
知识库
工具
OCRmyPDF—可智能
识
别PDF文本和图片信息的工具
如果需要,可以在执行OCR之前对图像进行纠偏和/或清洁 •验证输入和输出文件 •在所有可用的CPU核心之间分配工作 •使用Tesseract OCR引擎
识
别超过
OCRmyPDF
工具
企业
大语言模型LLM和知
识
图谱KG增强的企业搜索应用
搜索为LLM提供动力 原因有很多,但最主要的原因是LLM带来了能够超越搜索的新功能,这
意
味着更多的眼球和更多的广告收入。
开源模型
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音
识
别数倍加速
Whisper 是 OpenAI 研发并开源的一个自动语音
识
别(ASR,Automatic Speech Recognition)模型,他们通过从网络上收集了 68 万小时的多语言(
语音
HeyGen
如何用大语言模型构建一个知
识
问答系统
不要出现似是而非或无
意
义[1]的回答。
知识库
大模型
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任
意
宽高比输入
元象今日发布多模态大模型 XVERSE-V ,支持任
意
宽高比图像输入,在主流评测中效果领先。
XVERSE-V
多模态大模型
阿里
淘宝模特全体注
意
!阿里AnyDoor AI换装神器出来了,年度最强AIGC重制绘图工具,重塑电商模特产业
想象一下,在阿里的AnyDoor世界里,你可以自由穿梭于数不尽的时尚搭配中,只需几个简单步骤,你就能将任
意
一张图片中的元素,毫无违和感地转移到另一张图片中。
AnyDoor
换装
文生图
GPTs
“How to make money with GPTs” 教你集成第三方url的Action+知
识
库的完整版GPTs
创建一个GPT就像开始一个对话,给它指令和额外的知
识
,然后选择它可以执行的操作,如搜索网页、创建图像或分析数据。
GPTs
知识库
语音
国内厂商语音
识
别与Whisper评测:现状与概况对比
同时,Whisper(飞思卡尔语音
识
别技术)作为一项国际上也备受关注的语音
识
别技术,在语音
识
别领域也有着广泛的应用。
语音识别
Faster-Whisper
Google
AI“同声传译”新进展!Google发布,无监督,语音
识
别:Translatotron 3!
语音
识
别(ASR)是指将人类的语音转换为文本的技术,然而,目前的语音
识
别技术还面临着一些挑战,其中最大的一个就是如何支持更多的语言。
Translatotron
语音识别
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100