首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· AI换脸:FaceFusion 3.5.0更新,解决老版本无法使用问题!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 大模型应用中大部分人真正需要去关心的核心——Embedding
· 史上最好的中文大预言模型出现了!!!
· 可能是国产最强AI,ChatGLM-4来了!
· 十大开源语音识别项目
· 模型压缩:量化、剪枝和蒸馏
· FaceFusion又更新咯,增强功能再增强!
· 玩转大模型必备:milvus向量数据库私有化安装部署及使用介绍
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
Ollama的
本
地化又一图形工具ChatOllama,让你轻松玩
转
ollama,ChatGPT
2.2.安装
本
项目有两种安装方式,这里是使用离线下载安装方式,另外还有docker安装方式。
ChatOllama
安装
6.2K Star!MIT出品的多
语
言
语
音
合成神器,CPU实时推理吊打商业软件!
呵呵,不是不支持就是发
音
像老外学中
文
多
语
言切换?
MeloTTS
语音工具
开源
[中
文
开源震撼首发]33B QLoRA大
语
言模型Anima真的太强大了!QLoRA技术可能是AI
转
折点!
我们开源了第一个中
文
QLoRA 33B大
语
言模型——Anima。
开源模型
开源
有感情的
语
音
合成开源模型:ChatTTS安装使用详解
ChatTTS是一个为对话场景设计的
语
音
生成模型,专门用于大型
语
言模型(LLM)助手的对话任务、对话
语
音
和视频介绍等应用。
ChatTTS
语音合成
【进阶】-
文
生图术
语
解释
念咒 提示词组合 (prompts) 施法/吟唱/t2i
文
本
转
图像 (txt2img) i2i
文生图
国内厂商
语
音
识别与Whisper评测:现状与概况对比
本
文
旨在通过对国内几家主要厂商的
语
音
识别技术与 Whisper 技术进行评测和对比,以期更全面地了解国内
语
音
识别技术的现状与概况。
语音识别
Faster-Whisper
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生成视频插件
huggingface.co/guoyww/animatediff 如果无法下载,公众号回复 animatediff 获取下载链接,找到 mm_sd_v15_v2.ckpt 放到
本
地的目录中即可
动画
视频
AnimateDiff
开发
语
音
产品时设计唤醒词和命令词的技巧
在实际开发
语
音
产品过程中,要达到好的
语
音
识别效果,除了
语
音
算法要给力外,设计出好的唤醒词和命令词也能起到事倍功半的效果。
语音产品
唤醒词
命令词
Stable Diffusion
Stable Diffusion图生图(真人
转
动漫)
一、简介 今天给大家分享使用Stable Diffusion图生图进行真人
转
动漫,木木共使用了五种模型进行真人
转
动漫测试,重绘幅度在0.45~0.6之间,如果重绘幅度过大,会导致生成的图片偏离主体样貌
StableDiffusion
图生图
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉大秀中
文
」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
神奇的 OuteTTS - 0.1 - 350M:用几秒钟
音
频克隆声
音
的黑科技!
在当今数字化时代,
文
本
转
语
音
(TTS)技术的应用愈发广泛,从智能
语
音
助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的
语
音
合成。
OuteTTS-0.1-350M
音频
开源
GPT-4o实时
语
音
方案提供商Livekit开源voice agent:轻松处理
音
视频流
该框架包括用于常见工作流程的插件,例如
语
音
活动检测和
语
音
转
文
本
。
voice
agent
开源
音视频
大模型
Stability AI开年首个大模型:专写代码,支持18种编程
语
言,上下
文
100K,苹果笔记
本
离线就能跑
Stable Code 3B可理解处理18种不同的编程
语
言,上下
文
长度100K token。
Stability
AI
大模型
Stable Diffusion
Stable Diffusion AnimateDiff | 最火
文
本
生成视频插件库
huggingface.co/guoyww/animatediff 如果无法下载,公众号回复 animatediff 获取下载链接,找到 mm_sd_v15_v2.ckpt 放到
本
地的目录中即可
动画
视频
AnimateDiff
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于
文
生图、图生
文
、
语
音
转
文
字、
文
字合成
语
音
等),从而让LLM能驱动其他智能Agent,实现多模态能力。
提示词
prompt
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100