首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· AI Agent行业深度:框架拆解、应用方向、应用领域及相关公司深度梳理
· Coze、Dify、FastGPT:哪款智能体平台最强?深度对比分析!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· 企业如何更好的使用大模型?都有哪些框架和方案
· AI写作:如何写出逻辑清晰,结构完整的文章?一个提示词帮你搞定!
· 盘点字节跳动最新的AI应用
· 【AI绘图工具】太爆炸了,AI出图速度100fps(每秒100张图片),比LCM、SDXL Turbo更快,目前No.1
· Suno音乐新手指南(手把手完整版教程)
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
爆火「视频版ControlNet」开源了!靠提示词精准换画风,全华人团队出品
甚至一大片穗子,在原视频里怎么摆动,改变画风后频率和幅
度
也如出一辙。
ControlNet
开源
十大开源语音识别项目
· 项目地址:https://github.com/espnet/espnet star:7.3k ASRT ASRT 是一个基于深
度
学习的中文语音识别系统,在训练中使用了大量中文语音数据
语音识别
开源项目
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
该模型在显著降低噪声的同时,最大限
度
地保留了音频的自然音色,尤其适合音乐创作、专业录音和影视后期制作。
ClearerVoice-Studio
语音
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
GitHub:https://github.com/mli/autocut 项目采用的是 OpenAI 开源的自动化语音识别(ASR)系统,使用从网络收集的 68 万
小
时的多语言和多任务监督数据进行训练
开源模型
清华
清华、面壁智能发布:主动式Agent 2.0
评估指标:使用奖励模型对预测任务进行二元分类,并与人类标注结果进行比较,计算召回率、精确
度
、准确
度
和F1-Score
Agent
2.0
大模型
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
但无论如何,看到 OpenAI 保持如此迅猛的发展速
度
仍然令人欣慰。
检索增强生成
大语音模型
ai出图软件Fooocus
Fooocus可以算是集大成者,速
度
快,优化好,而且简单易用,非常之傻瓜。
Fooocus
文生图
Stable Diffusion
Stable Diffusion教程:文生图
11、提示词引导系数:提示词对生成图片的重要程
度
,值越大,图片中的内容越贴近提示词的描述,反之则Stable Diffusion 自由发挥的多。
文生图
Stable
Diffusion
开源
通过声音生成逼真的全身形象?!Meta开源AI工具:audio2photoreal
audio2photoreal的核心技术是基于深
度
学习的图像生成模型,它可以从音频中提取语音特征,然后用这些特征来控制人脸和身体的运动。
audio2photoreal
开源工具
视频
AI视频新技能!这套流程教你打造视频人物和声音完美同步!
该工具不仅生成嘴部运动的视频,还在头部区域呈现出匹配的变化,包括眼睛、头发和口腔细节,清晰
度
也非常高。
AI视频
教程
SD入门教程七:ControlNet篇-Canny边缘检测预处理器
选择预处理器(有些预处理器有多种子类别),选择辅助模型(有多种子类别模型精
度
不同效果也不一样,FP16/FP32指的就是精
度
Canny
SD
工具
AI文本转语音工具(TTS):MeloTTS
它可以让你听到不同的语言和口音,比如美式英语、英式英语、印
度
英语、澳大利亚英语等。
MeloTTS
语音工具
大模型
我为什么不看好大模型行业
破坏性创新理论- 该理论认为产品性能提升的速
度
通常高于市场吸收这些性能的速
度
,进而使得创新可能“过于好”却无人愿意付费,面临被破坏者后来居上的险境。
大模型
数据库
主流向量数据库一览
关于检索,主要是计算两个向量之间的相似
度
。
向量数据库
提示词
文生图生成不同年龄段模特的提示词
, bad teeth, bad arms, bad legs, deformities:1.1), 【中文意思:不适合工作场所,(最差质量,低质量,正常质量,低分辨率,细节欠佳,过饱和,欠饱和,过
度
曝光
年龄
文生图
<
...
79
80
81
82
83
84
85
86
87
88
...
>
1
2
4
5
6
7
8
9
100