首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 超详细的 Stable Diffusion ComfyUI 基础教程(二):文生图基础流程
· Suno音乐新手指南(手把手完整版教程)
· 数字人直播哪家强?百度、硅基、风平与闪剪四大AI数字人横向评测!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· videomaker.me
· 查理·芒格 :关于人生的13个忠告
· 如何最简单、通俗地理解Transformer?
· OpenAI大动作:Whisper large-v3重塑语音识别技术
· 火山写作
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
还在手写Prompt?这几大网站让你秒找大模型提示词!
强烈建议学习
AI
的都保存这个网站。
prompt
提示词
视频
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜视频实践
BERT的模型结构基于Transformer,它由多个
编
码器层组成。
Bert-vits
语音
阿里
《嬛嬛朕emo啦》但马斯克!阿里这项技术开放试玩
玩儿梗的人太多,以至于马斯克都给搞EMO了: ,时长00:05 而这背后的“始作俑者”,就是来自阿里通义实验室的EMO,继Sora之后热度第二高的
AI
视频项目
音频
阿里
开源
俄罗斯人开源了最大的文生图模型:参数量12B,比SDXL大了3倍多!
在开源Kandinsky 2.2之后,俄罗斯
AI
研究团队
AI
Forever又开源了新的文生图模型Kandinsky-3,这个模型最特别之处时采用了一个超大的text encoder(参数量为8.6B)
Kandinsky-3
文生图
开源模型
Midjourney
SDXL风格插件,超越Midjourney的时刻来了
在
AI
绘图圈,最著名的两大派系是stable diffsion和Midjourney。
SDXL
开源
腾讯悄悄开源混元版「Sora」,这就是开源领域的No.1。
开源地址:https://github.com/Tencent/HunyuanVideo 普通用户也可以去腾讯元宝APP,进入
AI
应用,就能看到这个
AI
视频了。
sora
视频生成
大模型
RPA和大模型结合:开启智能自动化的新纪元
其中,两种技术引起了广泛的关注和讨论,分别是RPA(Robotic Process Automation,机器人流
程
自动化)和大模型(Large Models,基于大规模数据和计算资源训练的深度学习模型
RPA
自动化
大模型
Transformer
图解 Transformer——功能概览
如上图所示,Transformer在训练过
程
中,模型对数据的处理过
程
如下,大体可分为 6 个步骤: 1.
Transformer
大模型
图解
ComfyUI
ComfyUI 图片以及工作流管理神器
不仅如此,还可以远
程
订阅官方或者大佬们公开的工作流网站,方便我们学习最新的工作流技术,与时俱进。
comfyui
工作流
LLM
Agent : 一文读懂LLM Agent架构,详解Profile,Memory,Planning,Action模块作用
格式上,内存信息可以用自然语言表达,也可以
编
码为向量嵌入提高检索效率。
大模型
LLM
Agent
Stable Diffusion
【Stable Diffusion操作升级】Stable Diffusion 常用模型下载与说明
(当然你可以通过训练自己的专有模型而专门用于某一用途,这也将成为你作为
AI
绘画者的最重要的核心竞争力之一) 因此,学会使用各类模型对于学习使用Stable Diffusion非常重要。
文生图
SD
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
文本引导的图像
编
辑(如“将天空的颜色改为亮蓝色”)具有挑战性,因为它要求模型同时理解文本指令和视觉内容。
文生图
心理
Asimov的预言与《Reflexion》的Prompt启示:机器人心理学家的新纪元
Susan Calvin 02 "Reflexion"的框架概述 正如Asimov的机器人心理学家深入探索机器人的思维,现代的
AI
研究者也在努力理解和改进机器学习模型的行为。
大模型
RAG
RAT = CoT + RAG
Retrieval Augmented Thoughts (RAT) 是一种协同思维链 (CoT) 和检索增强生成 (RAG) 的
AI
提示策略,助力解决具有挑战性的长任务推理和生成。
RAT
协同思维链
检索增强生成
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
更灵活的应用场景:无论是多人会议记录中区分不同发言者,还是多声道音频
编
辑,它都能轻松胜任。
ClearerVoice-Studio
语音
<
...
51
52
53
54
55
56
57
58
59
60
...
>
1
2
4
5
6
7
8
9
100