首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· Stable Diffusion快速生图,LCM-Lora、sd_xl turbo寄养和亲生谁好?!
· 零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
· 拒绝996,想出海赚美元?这7个GPT方案绝对靠谱!
· 大模型微调数据选择和构造技巧
· 深度|红杉重磅发布:2024 AI 50 榜单 (全网最全)
· 阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的人物活起来丨GenAICon 2024
· Prompt屠龙术-大厂prompt工程指南解析提炼
· 还没有上手Stable Diffusion XL 1.0 的同学,看这篇文章就够了
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
人工智能
2023年人工智能行业总结
年底谷歌发布了多模态大模型Gemini,可以理解文字、图片、代码和
音
视
频
。
人工智能
AGI
思考总结
教程
【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定
音
色、设置语速、添加停顿词、口头语、笑声!!
音
色一:男
音
色-铿锵有力效果展示 这是我经过挑选后男
音
对应的数据供768维。
chattts
tts
文生语音
ChatGPT
ChatGPT Prompt提示词课程(斯坦福吴恩达 | OpenAl)指南篇 极简笔记
对于大模型prompt的设计,近期斯坦福吴恩达伙同OpenAl出了一套视
频
教程(B站地址:https://www.bilibili.com/video/BV1AT41187qt?
prompt
大模型
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
3月,国内外模型公司动作
频
频
。
零一万物
YI
李开复
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
2303.17580.pdf HuggingGPT是近期非常火热的Agents方向的一个代表,它让ChatGPT这样的LLM能够使用HuggingFace社区的各种模型(包括但不仅限于文生图、图生文、语
音
转文字
提示词
prompt
你的下一个浏览器,可以是豆包电脑版!
万万没想到,现在看B站视
频
的打开方式,竟然可以这么AI了。
豆包
浏览器
数字人
如何免费打造自己的数字人主播:StableDiffusion插件SadTalker打造本地数字人主播
Sadtalker是一个能够根据图片和
音
频
生成视
频
的开源项目,它使用了一种叫做SadNet的神经网络,可以实现风格化的单图说话人脸动画。
数字人
ChatGPT
把ChatGPT装进二次元手办,你来吗?AI桌面机器人众筹
蓝牙
音
箱,语
音
控制小度丝滑流畅。
ai小车
esp32
开源
数字人
划重点!全网最全AI数字人工具合集!
· 选择语
音
:输入文字或录制语
音
,让数字人“说出”你想让他/她表达的内容。
AI
数字人
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
语
音
处理(Audio):语
音
处理指机器从大量的语
音
数据中提取语
音
特征,学习和发现其中蕴含的规律的过程。
开源
微软
BGE M3-Embedding:智源最新发布的text embedding模型,多语言检索效果超过微软跟openai
24年的第一个月,智源就发布了新一代text embedding模型BGE M3-Embedding,该模型支持超过100种语言,能够接受不同形式的文本输入,文本最大输入长度扩展到4192,并且支持包括稠密检索,稀疏检索,多向量检索三种不同检索手段。从实验结果上看,在多语言跟跨语种检索任务上,BGE M3-Embedding的效果超过之前提及的微软E5-mistral-7b微软E5-mistral-7b-instruct: 站在LLM肩膀上的text embedding以及openai去年底刚发布的第三代text embedding模型,对于长文本检 ...
BGE
M3-Embedding
多语音检索
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
AI 实现视
频
自动剪切 近几年,短视
频
的风口一直在持续,各大社交网站也都针对短视
频
流量进行大力扶持。
开源模型
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
学会SD之后可以画图、抠背景、制作商品展示图、制作建筑图、做Logo以及图标、做宣传画,甚至可以换脸、写真、做动画视
频
等。
SD
视频课程
AI绘画
开源
GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
Screenpipe 使用 Rust 语言开发,并提供灵活的插件系统,可与 Ollama 等工具协同工作,适用于从屏幕和
音
频
数据中获取实时分析的需求。
AIPC
ScreenPipe
开源
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
生成 如果需要克隆
音
色:请选择:“参考
音
频
”,如下图: 步骤如下: 1.
Fish
Speech
本地搭建
<
...
7
8
9
10
11
12
13
14
15
16
...
>
1
2
4
5
6
7
8
9
100