首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· AI异常值案例库第2期,5个灵感案例,新型流量获客法和产品形态
· Fooocus制作从小到老图
· 【CLIP系列Paper解读】CLIP: Learning Transferable Visual Models From Natural Language Supervision
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 最强国产开源多模态大模型MiniCPM-V:可识别图片、视频,还可在端侧部署
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· Stable Diffusion | 常见问题清点汇总
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
RAG
必读!RAG好用的3种Router
例如:写代码的Code-LM、做数学的meta-math,做
图
文多模态的Macaw-llm等等。
RAG
Router
语音
解读wav2lip:探究语音驱动唇部动作的技术原理!
,通常无法准确地合成口型,导致生成的
视
频与音频不同步,主要原因包括两方面: (1)传统的基于像素的人脸重建损失无法准约束音频-口型同步:因为面部重建损失是基于整个
图
像计算的,而唇部区域只占整个
图
像的很小一部分
wav2lip
语音
ChatGPT
从 ChatGPT 系统提示中,分享几个拿来就能用的prompt提示工程技巧
ChatGPT的强大毋庸置疑,特别是GPT4里面的数据分析、DALL.E 3
图
片生成等功能,以及近期推出的GPTs功能,这些官方公布的功能都是由他们自己内部的模型开发人员编写的提示词构成的。
ChatGPT
prompt
大模型
“大模型+机器人”的现状和未来,重磅综述报告来了!
在
视
觉感知方面,
视
觉Transformer模型展现出了强大的特征提取和泛化能力。
论文
机器人
自动化神器Autolt:不再重复工作
ensp; Autolt简介 Autolt是一种自动化脚本语言,旨在简化Windows
图
形用户界面
RPA
自动
开源
RAGFlow:开源的RAG引擎,专注于深入的文档理解,支持处理各种复杂格式的非结构化数据
支持处理各种复杂格式的非结构化数据,包括文本、
图
片、扫描副本、结构化数据和网页等。
RAGFlow
RAG
开源
LLM
确实很神奇! 通过 Prompt 中加入“这件事对我的事业至关重要”这样的情感激励可以提升 LLMs 的表现
尽管大型语言模型(llm)越来越被
视
为向人工智能迈进的一步,在许多任务中表现出令人印象深刻的表现,但llm是否能够真正掌握心理情绪刺激仍然不确定。
Prompt
大模型
情感激励
ComfyUI
ComfyUI-DDetailer脸部修复
翻看了上古时期出的
图
,突然老脸一红,有点惭愧。
ComfyUI
脸部修复
AIGC
一文读懂AIGC产业链:AIGC的前世今生和未来展望
(民生证券《电子行业专题研究:国产AI算力芯片全景
图
》) AIGC产业依赖算法、数据和算力的发展 2、中游,技术层: 它侧重核心技术的研发,主包括机器学习、计算机
视
觉、算法理论、智能语音、自然语言处理等
生成式AI
生成式AI工作流#产品经理和创业者的秘密武器
ComfyUI本质上是AIGC的Pipeline(数据处理管道)的可
视
化构建工具,它将Stable Diffusion的运行机制显性化的展示在我们面前。
AIGC
工作流
开源
书生·万卷:难得的中文开源数据集
书生·万卷这个语料库,包含文本数据集、
图
文数据集、
视
频数据集三部分,数据总量超过2TB。
大模型
数字人
腾讯开源的数字人MuseTalk到底行不行?
该模型能够根据输入的音频信号,自动调整数字人物的面部
图
像,使其唇形与音频内容高度同步。
MuseTalk
数字人
音频
基于 Kimi Chat 的 AI 渐进式阅读法
但我并不会为此感到焦虑,这些文章成了一个经过我筛选的“
图
书馆”,当我需要的时候,我可以在里面找到自己想要的文章进行阅读。
Kimi
Chat
阅读
人工智能
目前有哪些比较成功的人工智能应用?
视
频:广义上的各种动态
视
频的文件等。
生成式AI
数字人
划重点!全网最全AI数字人工具合集!
· 编辑
视
频:添加各种特效、背景音乐、字幕,让
视
频更富有看点。
AI
数字人
<
...
31
32
33
34
35
36
37
38
39
40
...
>
1
2
4
5
6
7
8
9
100