首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Cursor设计主管分享AI写出高质量代码的12个超绝妙招
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· ChatGLM智谱清言
· LLM大模型推理输出生成方式总结
· GPU 性能(数据表)快速参考
· 超级干货,自学stable diffusion,看完这篇就够了
· 全球六大主流自动PPT制作工具
· 微信搜狗爬虫WechatSogou - 从微信公众号获取文章的利器
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
学会这招,一个头像变100种风格!
可能有小伙伴看到一开始展示的那张图上的例子中,有很多是比较抽象的风格,比如第一排第三个,第二排第二个: 这类图如果你是在 V5, niji5 版本之间切换,可能永远都出不来,毕竟这画风和原图变
化
太大了
Remix
文生图
微软
微软打破Decoder-Only架构!大幅降低GPU内存需求,网友:把Llama3 70B弄20GB GPU上运行
去年一张“大语言模型进
化
树”动图在学术圈疯转,模型架构还只有三大类:Decoder-Only、Encoder-Only、Encoder-Decoder。
Decoder-Decoder
YOCO
架构
提示词
好看的图片不知道怎么写提示词?用AI读出来
3、其他用途 除了作为反推插件,Wd14 Tagger还被作为训练模型的必备工具,替代人工打标,减轻工作量,实现全面自动
化
“炼丹”。
文生图
Fastwhisper + Pyannote 实现 ASR + 说话者识别
同时在CPU和GPU上进行8位量
化
,可以进一步提高算法效率。
faster-whisper
语者识别
ASR
StableDiffusion
深度解析丨StableDiffusion在多个设计场景中的探索与应用
在当今数字
化
时代的设计领域,技术的发展不断引领着创新的方向,而StableDiffusion作为一款融合了人工智能与艺术的绘画软件,正为我们带来前所未有的设计可能性。
文生图
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
研究者通过从教师模型中复制整个编码器来初始
化
学生模型,并在训练过程中冻结它。
语音
HeyGen
AI国力战争:GPU是明线,HBM是暗线
这一产品基本完全被韩国的海力士和三星垄断,合计占市场份额的90%以上,丝毫不比GPU和CoWoS竞争格局差,而高度垄断,在这逆全球
化
的背景下,隐含的就是高供应链风险。
GPU
HBM
大模型
Stable Diffusion
Stable Diffusion | SD腾讯云3步部署,全程五分钟,附价格费用清单
应用类型:SD WebUI 或 SD API,前者提供可视
化
界面,后者提供 API 以便于集成到业务系统中。
下载
开源模型
GPTs
“How to make money with GPTs” 教你集成第三方url的Action+知识库的完整版GPTs
连接到自定义 API(不少人都跟我说不了解Action可以如何编辑) 比较重要的设置是两个 指定URL和description(有助于模型理解) scheme分析你获得的数据(结构
化
数据
GPTs
知识库
LLM
基于LLM+向量库的文档对话痛点及解决方案
回答:会造成冗余,但是笔者试验之后回答效果很好,无论是细粒度知识还是粗粒度(跨段落)知识准确度都比Longchain粗分效果好很多,对这个问题笔者认为可以优
化
但没必要 出自:https://zhuanlan.zhihu.com
开源模型
Prompt
硬核Prompt赏析:HuggingGPT告诉你Prompt可以有多“工程”
大模型在训练过程中,经历过指令微调和基于人类反馈的强
化
学习, 已经具备一定的指令遵从能力。
提示词
prompt
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
此外,它在JAX框架下的优
化
使其能够利用Google的TPU架构,这在处理大规模数据时提供了前所未有的速度优势。
Whisper
语音识别
Midjourney
Midjourney | 17个常用的命令
重置你的偏好设置(有时生成图片时会出现一些自己明明未添加的指令,却提示错误,可以执行一下这个命令) /prefer remix 切换混音模式(可以让你在重生成或者变
化
图片时修改描述语
文生图
GTC大会黄仁勋发言稿
世界上没有哪个会议能汇聚来自如此多元科学领域的研究人员,从气候科技到无线电科学,大家都在探索如何使用 AI 来机器人
化
控制 MIMOS,用于下一代 6G 无线电,自动驾驶汽车,甚至是各方面的人工智能。
黄仁勋
nvidia
开源
俄罗斯人开源了最大的文生图模型:参数量12B,比SDXL大了3倍多!
Kandinsky-3的主要优势还是在于文本理解方面,下面的对比图展示了这个优势,而Kandinsky 2.2容易出现概念的混淆: 由于Kandinsky-3训练过程中增加了俄罗斯文
化
的相关图像
Kandinsky-3
文生图
开源模型
<
...
73
74
75
76
77
78
79
80
81
82
...
>
1
2
4
5
6
7
8
9
100