首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 盘点字节跳动最新的AI应用
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· MCP服务介绍及应用场景报告-来自Manus
· 为你推荐开源项目:Meridian——专属个人情报站!
· SD入门教程二:文生图基础用法(提示词)
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 【万字长文-进阶教程】一文带你从入门到精通ChatTTS, 手把手教你固定音色、设置语速、添加停顿词、口头语、笑声!!
· 腾讯出品!开源AI数字人框架!号称可以不限时长
· ChatGLM智谱清言
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
在前期的开发者邀测中,拥有阿里、美团等多家大厂
工
作
经历的知乎大佬@苏洋就利用Yi的API搭建出了一个翻译器应用。
零一万物
YI
李开复
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(下)
AutoGPT是一个
流
行的开源项目,旨在实现完全自主的系统。
大模型
Stable Diffusion
造梦师手记:腾讯加入Stable Diffusion的ControlNet模型开发,效果艳丽
ghostmix模型
作
者认为,应该尽可能的少做大模型,然后使用lora、ControlNet等微调
工
具来适配更多的场景。
Stable
Diffusion
Sora
解读OpenAI Sora文生视频技术原理
二、扩散模型与Diffusion Transformer,组合成强大的信息提取器 OpenAI 讲Sora 是一个Diffusion Transformer,这来自伯克利学者的
工
作
sora
开源
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
但是近期,网易有道AI算法团队也开源了一款国产TTS语音合成引擎EmotiVoice,刚上线仅一周时间就暴涨4200颗星,问鼎当周GitHub trending
流
行榜第一。
EmotiVoice
语音库
让你不怕任何事的3个顶级思维(建议收藏)
在人生的旅
程
中,我们经常会面临各种各样的挑战和困境。
灰度思维
减法思维
生成式AI与大语言模型的区别
你可以交互式地指导生成过
程
,提供最终产生视觉上引人入胜输出的高层指导。
生成式AI
大语言模型
区别
微软
2.7B能打Llama 2 70B,微软祭出「小语言模型」!96块A100 14天训出Phi-2,碾压谷歌Gemini nano
11月OpenAI先是用GPTs革了套壳GPT们的命,然后再不惜献祭董事会搏了一波天大的
流
量。
小语言模型
大模型
阿里云开源通义千问多模态大模型Qwen-VL,持续推动中国大模型生态建设
在主
流
的多模态任务评测和多模态聊天能力评测中,Qwen-VL取得了远超同等规模通用模型的表现。
大模型
AI面部增强器-Remini
好
工
具不嫌多,哪怕之前本号已经推荐过好几款图像处理
工
具,今天还是给大家再次带来一个图像处理神器-Remini。
Remini
面部增强
修复
文生图
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
在当今数字化与智能化浪潮汹涌的时代,人
工
智能技术不断取得突破性进展,多模态模型
作
为其中的前沿领域,正日益成为研究和应用的热点。
OmniVision
-
968M
多模态模型
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
今天不讨论 GPT-4o 的炸裂或颠覆,而是探讨如何
作
为个人或独立开发者实现这项技术,以及它的应用场景。
GPT-4o
语音交互
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
以前关于遵循指令的
工
作
主要是通过继承大型(多模态)LLMs的能力,采用轻量级的监督微调来激活模型的能力以与用户意图对齐。
大模型
语音
开源
OCR是什么以及推荐几款开源中文OCR识别软件
二、OCR的基本
流
程
1.
OCR
换脸
WebUI使用用InstantID,AI换脸完美版
从路线上看,主要有两条路线,一是一张图换脸,优点是操
作
简便,缺点是换个姿势的时候,往往不太像,roop等插件是基于这个思路;二是炼制专属LoRA,用目标的5-20张甚至更多脸部照片,训练一个LoRA,从而生成满意的换脸画面
换脸
小红书
<
...
40
41
42
43
44
45
46
47
48
49
...
>
1
2
4
5
6
7
8
9
100