首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 制作可爱的表情包
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 盘点字节跳动最新的AI应用
· GPU 性能(数据表)快速参考
· Suno歌曲制作
· 国内外开源大语言模型一览表
· 达摩院SPACE对话大模型:知识注入与知识利用
· SD-WebUI和ComfyUI的局域网访问设置
· 提示词框架:BROKE
· 【爆肝整理】500+ AI 最佳提示词
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
ChatGPT
三个大模型(ChatGPT,文心一言,Baichuan-13B),帮我
生
成
中医《本草纲目》的训练数据
因此,只要把其中以数字(1,2,3等)序号里的文本摘出来,处理
成
JSON格式,然后把它们变
成
一个问-答 对的形式,模仿病人和医
生
的对话,就可以放到大模型训练了。
大模型
AI绘画Stable-Diffusion风格化实战
在社交软件和短
视
频
平台上,我们时常能看到各种特色鲜明的
视
觉效果,比如卡通化的图片和中国风的
视
频
剪辑。
Stable-Diffusion
文生图
数字人
AI虚拟主播数字人技术实现Wav2Lip
第二部分:Wav2lip技术概述 Wav2Lip技术是一个基于GAN的唇形
动
作迁移算法,实现
生
成
的
视
频
人物口型与输入语音同步。
数字人
视频
开源
清华&面壁开源新一代主
动
Agent交互范式!让AI从被命令到主
动
帮助
左侧的被
动
式 Agent 只能被
动
接受用户指令并
生
成
回复,而右侧的主
动
式 Agent 可以通过观测环境主
动
推断与提出任务。
Agent
大模型
健康
教小朋友学习AI绘画的同时避免
生
成
不健康图片
像Stable Diffsion这种开源软件,
自
己用的时候,经常会有意无意的
生
成
NSFW(简单翻译是工作时间不宜点开,主要是涩涩图),但很多中小平台也在使用该软件,如果出现不健康图片,怕是要关停网站了,
小朋友
绘画
Prompt
17岁高中
生
写了个神级Prompt,直接把Claude强化
成
了满血o1。
然后,又
生
成
了德州扑克,不仅可以玩,还是带了AI玩家的那种。。。
prompt
大模型
Midjourney
[Midjourney]人物镜头拍摄
视
角大全
掌握常用的10种拍摄
视
角,教你绘画出好的人像。
视图
视角
构图
开源
5个最佳开源RPA框架
Robot Framework能够大大简化业务运营、改善了IT基础设施、减少了工作量与
成
本,同时还能提高企业的整体灵活性,具备良好的可扩展性,可以为企业建立虚拟员工、能够很容易地与其他
自
动
化工具集
成
,使业务流程
自
动
化
开源模型
智能自动化
开源
【开源项目】Flow Matching 语音合
成
CFM是一种新技术,已被证明可以改进扩散模型,Meta的Voicebox模型将CFM引入语音合
成
领域,下面是voicebox的一个工作流程图 Matcha-TTS是第一个开源conditional
音视频
Flow
Matching
动
作识别模型有哪些
其实在这之前也有人尝试用深度学习来处理
动
作识别,例如李飞飞团队通过叠加
视
频
多帧输入到网络中进行学习,但不幸的是这种方法比手
动
提取特征更加糟糕。
动作识别
模型
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk是由腾讯团队开发的先进技术,它是一个实时高质量的音
频
驱
动
唇部同步模型。
MuseTalk
数字人
音频
零一万物
零一万物API开放平台出场!通用Chat多模态通通开放,还有200K超长上下文版本
3月,国内外模型公司
动
作
频
频
。
零一万物
YI
李开复
斯坦福宣布前端开发要失业了?!一张截图
生
成
代码,64%优于原网页!
研究人员手
动
策划了一个包含484个多样化的真实世界网页的测试案例,并开发了一套
自
动
评估指标,以评估当前多模态LLMs在将截图作为输入的情况下,能够多么精确地
生
成
直接渲染
成
给定参考网页的代码实现。
设计转代码
大模型
阿里
体验完阿里的EMO模型,我emo了
简单来说,EMO(Emote Portrait Alive)是一个AI肖像
视
频
生
成
系统,能够通过输入单一的参考图像,
生
成
具有一定表现力的面部标签和各种头部姿态。
EMO
文生图
Prompt
让你每次都随机
生
成
各种图片,开盲盒的感觉:SD插件之无限抽卡神器Dynamic Prompts
到时候就直接把通配符“__Muggle时尚穿搭(带背景)__”复制过去,打开组合
生
成
就可以了。
文生图
<
...
8
9
10
11
12
13
14
15
16
17
...
>
1
2
4
5
6
7
8
9
100