首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 两个案例教你如何用BRTR原则优化Prompt
· 万字长篇!超全Stable Diffusion AI绘画参数及原理详解
· ComfyUI-DDetailer脸部修复
· 我用AI写小说:「素材篇」4种大神写爽文技巧+找素材新思路+三翻四震举例说明
· 文心一言大模型使用指南
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
十大开源语音
识
别项目
这些项目不仅在语音技术领域具有重要
意
义,而且为语音
识
别应用的发展提供了有力的支持。
语音识别
开源项目
Transformer
万字长文震撼来袭!揭秘Transformer——吐血解读自注
意
力机制的革命性突破
自注
意
力(有时也称为内部注
意
力)是一种注
意
力机制,它关联单个序列中不同位置的信息,以计算序列的表示。
Transformer
大模型
AIGC
AIGC沸腾200多天后,投资人达成三大共
识
在AIGC不断发酵的200多天里,投资人们达成了哪些共
识
?
大模型
大模型
面向知
识
图谱的大模型应用
知
识
图谱的应用由来已久,如果企业已经投资了知
识
图谱系统,而且效果还不错,需要用LLM重新实现一遍么?
知识图谱
大模型
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知
识
库
如果不满
意
调整训练的参数再次进行训练。
知识库
教程
openpose原理及安装教程(姿态
识
别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或视频中的人体关键点,并且能够
识
别不同的身体部位和动作。
行为识别
姿态识别
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说
意
味着什么?
虽然其中重要内容很多,但一条具有革命性
意
义的消息让人很难不注
意
到:OpenAI消除在某些用例中对纯向量数据库的需求。
检索增强生成
大语音模型
开源
人脸
识
别的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸
识
别算法和工具。
人脸识别
开源项目
baichuan2 有什么好的 深挖论文中涉及的知
识
点
ChatGPT 在各种领域都表现出了强大的语言能力,从随
意
交谈到解释复杂概念。
大模型
开源
开源免费离线语音
识
别神器whisper如何安装
whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨
识
能力已达到人类水准的Whisper神经网络,且它亦支持其它98种语言的自动语音辨
识
。
wisper
翻译
免费
OCR
14.6K star!最好用的OCR文字
识
别项目,没有之一!
伙伴们,平时都会用到文字
识
别吧?
Umi-OCR
开源项目
文字识别
Transformer
TrOCR——基于transformer模型的OCR手写文字
识
别
前期我们使用大量的篇幅介绍了手写数字
识
别与手写文字
识
别,当然那里主要使用的是CNN卷积神经网络,利用CNN卷积神经网络来训练文字
识
别的模型。
OCR
手写
文字识别
Stable Diffusion
stable diffusion 远端跑图—— Api基础知
识
掌握
应该输入的是127.0.0.1:7860/sdapi/v1/txt2img,具体端口可能不同 然后直接复制我上边的请求内容放入body里面,记得先选择json模式 点击send按钮,如果没有
意
外地话
文生图
api
语音
Insanely Fast Whisper:超快的Whisper语音
识
别脚本
这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。作者提供了几种优化方式,包括批处理、半精度处理以及BetterTransformer,以提高转录速度。最终,作者以实际测试数据展示了不同优化方式的速度对比。同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。
音频
Whisper
开源
来个优秀的开源人脸
识
别项目!
虹膜
识
别技术通过全自动照相机寻找并聚焦虹膜,实现高精度
识
别。
人脸识别
开源项目
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100