首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Trickle + Nano Banana,我给老婆 VibeCoding 了一个虚拟试衣间
· 制作可爱的表情包
· 一个完整Prompt让ChatGPT自动生成短视频制作脚本
· 如何构建基于大模型的App
· 国产视频制作之光-可灵:提示词大全整理
· 巧用这13个原则!创作ChatGPT提示词Prompt时效率提高10倍!
· 数字人直播哪家强?中国数字人平台分析大全
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
· AI领域的agent是什么意思?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Transformer
万字长文震撼来袭!揭秘Transformer——吐血解读自注
意
力机制的革命性突破
自注
意
力(有时也称为内部注
意
力)是一种注
意
力机制,它关联单个序列中不同位置的信息,以计算序列的表示。
Transformer
大模型
AIGC
AIGC沸腾200多天后,投资人达成三大共
识
在AIGC不断发酵的200多天里,投资人们达成了哪些共
识
?
大模型
开源
十大开源语音
识
别项目
这些项目不仅在语音技术领域具有重要
意
义,而且为语音
识
别应用的发展提供了有力的支持。
语音识别
开源项目
语音
语音
识
别的新拐点:OLMoASR 带来的机会
这就是为什么开源 ASR 的出现
意
义非凡:它让这些可能性变得 更低成本、更普惠。
OLMoASR
语音识别
大模型
面向知
识
图谱的大模型应用
知
识
图谱的应用由来已久,如果企业已经投资了知
识
图谱系统,而且效果还不错,需要用LLM重新实现一遍么?
知识图谱
大模型
ChatGLM
LangChain + ChatGLM2-6B 搭建私域专属知
识
库
如果不满
意
调整训练的参数再次进行训练。
知识库
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说
意
味着什么?
虽然其中重要内容很多,但一条具有革命性
意
义的消息让人很难不注
意
到:OpenAI消除在某些用例中对纯向量数据库的需求。
检索增强生成
大语音模型
开源
人脸
识
别的开源的项目有哪些?
OpenCV:OpenCV(Open Source Computer Vision Library)是一个广泛使用的计算机视觉库,提供了许多人脸
识
别算法和工具。
人脸识别
开源项目
教程
openpose原理及安装教程(姿态
识
别)
OpenPose是一个用于实时多人姿态估计的开源库,它可以检测图像或视频中的人体关键点,并且能够
识
别不同的身体部位和动作。
行为识别
姿态识别
Transformer
TrOCR——基于transformer模型的OCR手写文字
识
别
前期我们使用大量的篇幅介绍了手写数字
识
别与手写文字
识
别,当然那里主要使用的是CNN卷积神经网络,利用CNN卷积神经网络来训练文字
识
别的模型。
OCR
手写
文字识别
开源
几款开源的OCR
识
别项目,收藏备用
github.com/PaddlePaddle/PaddleOCR.git EasyOCR EasyOCR是用Python编写基于Tesseract的OCR
识
别库
OCR
ChatGLM
基于本地知
识
的问答机器人langchain-ChatGLM
但是这些模型学到的知
识
是滞后的(比如ChatGPT的知
识
是截止到2021年),并且这些知
识
是通用领域的。
langchain
Stable Diffusion
stable diffusion 远端跑图—— Api基础知
识
掌握
应该输入的是127.0.0.1:7860/sdapi/v1/txt2img,具体端口可能不同 然后直接复制我上边的请求内容放入body里面,记得先选择json模式 点击send按钮,如果没有
意
外地话
文生图
api
语音
Insanely Fast Whisper:超快的Whisper语音
识
别脚本
这篇内容介绍了OpenAI的Whisper Large v2语音转录模型的超快速能力。通过使用Transformers和Optimum技术,可以在不到10分钟内转录300分钟(5小时)的音频。作者提供了几种优化方式,包括批处理、半精度处理以及BetterTransformer,以提高转录速度。最终,作者以实际测试数据展示了不同优化方式的速度对比。同时,还提到了Whisper.cpp的性能测试、4位推断性能测试、以及一个CLI工具的社区展示。这篇文章旨在展示如何使Whisper模型在转录2-3小时的音频时更加高效。
音频
Whisper
开源
来个优秀的开源人脸
识
别项目!
虹膜
识
别技术通过全自动照相机寻找并聚焦虹膜,实现高精度
识
别。
人脸识别
开源项目
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100