首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 大模型评测新思路:弱智吧精华问题大全
· Slea.ai
· F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 大模型推理能力增强方法总结
· 6个最佳开源TTS引擎
· 十大开源语音识别项目
· 微信向量检索分析一体化数仓探索:OLAP For Embedding
· 企业如何更好的使用大模型?都有哪些框架和方案
· 目前最强图像编辑模型——Nano banana可以免费用了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Fastwhisper + Pyannote 实现 ASR + 说话者识别
前言 最近在研究ASR相关的业务,也是调研了不少
模
型
,踩了不少坑,ASR这块,目前中文普通话效果最好的应该是阿里的modelscope上的中文
模
型
了,英文的话,还是非whisper莫属了,而且
faster-whisper
语者识别
ASR
LLM
让AI记住你说的话、让AI给你生成几十万字的小说!StreamingLLM 让无限长token成为可能
如今全世界有很多公司都在研究AI
大
模
型
(LLM)。
StreamingLLM
写作
LLM
PymuPDF4llm:PDF 提取的革命
PDF 文件作为一种广泛使用的文档格式,包含着
大
量有价值的信息。
PymuPDF4llm
PDF
SDXL
它来了!SDXL + ControlNet 终于强强联合!
那么
大
家可能就会会有疑问了,老版本的 ControlNet
模
型
能不能在 SDXL 中使用呢?
SDXL
pdf2htmlEX:效果相当好的一个PDF转HTML程序,和原始PDF几乎一
模
一样。
项目简介 这应该是效果相当好的一个PDF转HTML程序,生成的结果和原始PDF几乎一
模
一样。
PDF转换
本地部署操作AI抠图软件
百度飞桨PP的 PaddleSeg内置了两个
模
型
PP-Matting 和 PP-MattingV2。
抠图
ComfyUI
Fooocus,webui,comfyui优缺点
首先fooocus更新到860了 加了蒙版和反转蒙版,推荐下载中文版,还带之前的实时
绘
图。
Fooocus
webui
comfyui
文生图
Agent
【Agent专题】Agent架构设计:智能体架构设计的9
大
核心技术全景深解析,附架构图
全量微调适合定制
大
模
型
,PEFT等轻量方式适合场景微调。
Agent
智能体架构
Animatediff V2 版本来了!就一个字:秀
Lora,官方更新了 8 个运动
模
型
Lora,让我们可以自由控制动
画
画
面的走向。
Animatediff
文生图
一文带你认识ELMo
训练了从左到右或从右到左的语言
模
型
。
embedding
微信向量检索分析一体化数仓探索:OLAP For Embedding
背景 在过去的一年里,
大
型
语言
模
型
(LLM) 以及 ChatGPT 等产品吸引了全世界的想象力,推动新一轮技术浪潮。
OLAP
For
Embedding
一体化数仓
LLM
个人从零预训练1B LLM心路历程
其实在当时就有不少些这种“从零预训练LLM”的开源项目了,但是
大
多训练的数据量或者是
模
型
都很小(几块4090+几十G数据就能跑起来),并没有暴露出一些工程上的问题,训练细节也没有分享的特别清晰。
LLM
训练
开源
6个最佳开源TTS引擎
提供预训练
模
型
,以及用于测量数据集质量的工具,支持用于产品和研究的20多种语言,包括支持中文。
TTS引擎
开源模型
开源
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
这款机器人的主要特点包括开源ROS软件、硬件开源、小尺寸、低价格、
模
块化驱动以及强
大
的扩展性。
ROS
机器人
开源模型
Stable Diffusion
Stable Diffusion基础:ControlNet之身份标识
本文给
大
家分享一个新的ControlNet类
型
:Instant ID,翻译为身份标识,核心能力是由国内的小红书团队开发的。
ControlNet
文生图
<
...
65
66
67
68
69
70
71
72
73
74
...
>
1
2
4
5
6
7
8
9
100