首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· PPT又又有新突破了!智谱AI代码流造PPT
· Comfyui工作流管理插件,再也不用保存本地了!
· 如何将 GPT 幻觉发生率从 20% 以上降低到 2% 以下
· 如何修复GPT幻觉、及评估数据集的挑战
· 必看!ComfyUI故障应对指南,让您轻松应对每一个挑战
· 十大开源语音识别项目
· Stable Diffusion插件:提示词
· 令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
· Fastwhisper + Pyannote 实现 ASR + 说话者识别
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
开源免费离线语音识别神器whisper如何安装
whisper的日常用途 whisper的核心功能语音识别,对于学生党和
工
作
党来说,可以帮助我们更快捷的将会议、讲座、课堂录音整理成文字稿;对于影视爱好者,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源
wisper
翻译
免费
大模型
LLM大模型推理输出生成方式总结
参数设置:do_sample = False, num_beams>1 缺点:虽然结果比贪心搜索更
流
畅,但是仍然存在生成重复的问题 Multinomial sampling(多项式采样) 方式
大模型
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等模型的音频生成开发框架
音乐可能是最具挑战性的音频类型,因为它由局部和长
程
模式组成,从一系列音符到具有多种乐器的全局音乐结构。
开源模型
大模型
中文LLaMA-2基座模型和Alpaca-2指令精调大模型-中文LLaMA-2以及Alpaca-2系列模型
词表扩展了中文字词(LLaMA:49953,Alpaca:49954),以期进一步提升模型对中文文本的编解码效率 在本项目中,我们重新设计了新词表(大小:55296),进一步提升了中文字词的覆盖
程
度
大模型
Midjourney
SDXL风格插件,超越Midjourney的时刻来了
我在研究模型的时候,发现很多严肃的SD模型创
作
者都逐渐有一个困惑: 模型层出不穷,却同质化严重,有没有一种可能,可以整合所有的大模型,就靠一个模型出图?
SDXL
开源
构建开源多模态RAG系统
在这个新的冒险中,我们将深入研究使用开源大型语言多模态(LLMM)构建检索增强型生成(RAG)系统的过
程
。
RAG
大模型
Prompt
Dynamic Prompts插件,魔法提示词由魔法帮你补全(插件篇)
怎么操
作
这个插件功能很多,基础功能不需要单独或者后台下载模型,装好就能用;我们需要的魔法功能在后面,我们逐一介绍下去,着急的可以跳过。
文生图
提示词
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
这样,模型就可以学习到更准确和更
流
畅的翻译方式,而不需要有真实的双语言的语音数据集。
Translatotron
语音识别
通义千问
阿里AI黑科技大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
阿里动
作
太过频繁,就我的脑海回忆,推出了挺多东西的,效果还都不错,今天盘点下都有哪些。
阿里云
视频
音频
Fastwhisper + Pyannote 实现 ASR + 说话者识别
github.com/SYSTRAN/faster-whisper 二、pyannote.audio介绍 pyannote.audio是一个用Python编写的用于扬声器diarization的开源
工
具包
faster-whisper
语者识别
ASR
数字人
最强开源数字人对口型系统介绍
使用过原版开源的Wav2Lip的都知道,原
作
者使用分辨率很低的图像数据集训练的模型,嘴部特别清晰,基本没啥价值,但是 这个框架和算法倒是不错,如果想得到高清模型,得付出相当大的精力去收集高清数据集从头训练
数字人
开源模型
LLM
从零开始用LangChain、Pinecone和LLMs搭建你自己的文档问答系统
一、简介 今天我们将深入探讨使用LangChain和Pinecone创建基于文档的问答系统的过
程
,利用最新的大文本语言模型(LLMs),如OpenAI GPT-4和ChatGPT。
知识库
langchain
开源
无显卡+纯本地跑Qwen1.5版模型!0基础闭眼部署指南!适用绝大部分开源模型!llama2+Mistral+Zephyr通杀!
点击下方小
程
序申请加入!
Qwen1.5
开源模型
LLM
一文汇总大语言模型LLM所有prompt提示词框架的论文出处
从最小到最多):https://arxiv.org/abs/2205.10625 - Step Back(后退提示):https://arxiv.org/abs/2310.06117 - ART(自动推理和
工
具使用
prompt
提示词
Stable Diffusion
深入浅出学习Stable diffusion之线稿转效果图
模型类型: 我们要知道现在的集中主要
流
行模型。
Stable
Diffusion
文生图
大模型
<
...
84
85
86
87
88
89
90
91
92
93
...
>
1
2
4
5
6
7
8
9
100