首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI自动生成视频全流程干货
· Suno音乐新手指南(手把手完整版教程)
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· GPU 性能(数据表)快速参考
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
提示词
AI提示词|一词千金,写提示词的这个技巧你一定没想到!(一)
利用NLP的请求:「请检查这篇文章的语
法
和清晰度,并提出改进句子结构的建议。」
提示词
写作
ChatGPT
ChatGPT写论文最强指令!
我希望对我的论文进行润色和编辑,请帮我修改语
法
、句子结构和流畅性 请仔细检查我的论文,以确保语
法
准确、句子流畅,并改进任何不清晰或非正式的表达。
ChatGPT
指令
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
下面是模型结构示意图 下面是并行去噪算
法
示意图 MuseTalk:实时高质量口型同步模型 值得一提的是,MuseV团队最近发布了MuseTalk,这是一个实时高质量的口型同步模型,可以与MuseV
MuseV
视频
数字人
框架
一个令人惊艳的图片高清化重绘神器:SUPIR来了!
所以这又给我提供了一个新的思路,先通过之前SD WebUI的方
法
对图片进行高清处理,再通过SUPIR进一步处理,我们仍然能获得一些收益。
SUPIR
文生图
开源
开源免费离线语音识别神器whisper如何安装
本文目的 网络上有些教程只展示了whisper使用的效果,没有介绍怎么安装,为避免大家在安装上踩坑,同时也为了避免自己以后万一哪天电脑崩溃需要重装whisper的时候再踩坑,我在这里记录下安装方
法
。
wisper
翻译
免费
Stable Diffusion
Stable Diffusion 加速/优化/升级 优化出图速度
关闭模型哈希计算 关闭可节省启动时间,但会导致页面内与图片生成数据中无
法
正常显示模型哈希信息,适用于低速硬盘。
Stable
Diffusion
文生图
大模型
最强开源大模型Llama 3,在扎克伯格设想中其实是这样的
我从根本上无
法
经营某件事或经营自己的生活,也无
法
尝试建造我认为有趣的新事物。
Llama
3
大语言模型
Stable Diffusion
stable diffusion 远端跑图—— Api基础知识掌握
; "sd_model_checkpoint" :"wlop-any.ckpt [7331f3bc87]"}, // 一般用于修改本次的生成图片的stable diffusion 模型,用
法
需保持一致
文生图
api
比尔盖茨最新预言:AI智能体颠覆计算机交互体验甚至软件行业
但还有很多未满足的需求,许多本来可以从治疗中受益的人却无
法
获得治疗。
AI智能体
Google
AI“同声传译”新进展!Google发布,无监督,语音识别:Translatotron 3!
无监督的嵌入映射(Unsupervised Embedding Mapping):这是一种可以把不同语言的语音或文字的内部表示,映射到一个共同的空间的方
法
。
Translatotron
语音识别
儿童
AI赋能实验室:儿童绘本插图
--ar 16:9 --v 6.0 --s 250 --style raw 译文: 这是一个充满奇妙想象的儿童插图,描绘了一个充满好奇的[动物]在一个充满活力和魔
法
的[地点]展开了一段愉快的冒险
插画
文生图
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
CM3leon是第一个使用从纯文本语言模型改编的方
法
进行训练的多模态模型,包括大规模检索增强预训练阶段和第二个多任务监督微调(SFT)阶段。
文生图
RAG
LLM之RAG实战(五)| 高级RAG 01:使用小块检索,小块所属的大块喂给LLM,可以提高RAG性能
在这篇博客文章中,我们将深入研究这两种方
法
在LlamaIndex中的实现。
RAG
检索
Github
GitHub工程师分享开发Copilot所采用的提示词工程
总的来说,他们建议的方
法
是基于一系列步骤的。
开源模型
开源
F5-TTS:上海交大开源超逼真声音克隆TTS,告别ElevenLabs,以后就用它了!实测真的很牛
2、流匹配技术: F5-TTS中采用了先进的流匹配技术,这是一种基于最优传输路径的方
法
,用于改进生成模型的学习过程。
F5-TTS
音频克隆
<
...
40
41
42
43
44
45
46
47
48
49
...
>
1
2
4
5
6
7
8
9
100