首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 使用ChatGPT润色出高品质文章!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 胎教级SO-VITS-SVC使用教程:人工智能生成歌曲
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 四种微调技术详解:SFT 监督微调、LoRA 微调、P-tuning v2、Freeze 监督微调方法
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· 实操:基于 Ollama+AnythingLLM 的 AI 超级阅读法
· 从零开始了解AI大模型 - 概念篇:一文带你走进大模型世界
· 大模型量化:什么是模型量化,如何进行模型量化
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话人提取
.01 概述 在日常生活和工
作
中,你是否常因嘈杂的环境、重叠的对话或音
视
频
信号的混杂而感到沟通困难?
ClearerVoice-Studio
语音
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/
视
频
/音
频
/文本
在
视
频
对齐领域,
作
者从开源和内部来源获取
视
频
数据。
Baichuan-Omni
多模态大模型
独家!黄太吉
创
始人再
创
业:首次披露惨败内幕
作
为网红餐饮的鼻祖,赫畅在社交媒体上消失了。
黄太吉
创业
Roop参数说明,ROOP->StyleGAN演示!
因为这个
视
频
刚好有很多张脸,然后又是多角度60帧4K的动态
视
频
,所以我觉得非常适合拿来测试ROOP。
视频
StyleGAN
阿里
阿里&字节发表VividTalk,只需单张照片即可根据音
频
生成栩栩如生的人物说话头像
视
频
,并将其
作
为生成器的输入来合成最终的
视
频
。
VividTalk
视频
Sora
OpenAI Sora
视
频
生成模型技术报告中英全文+总结+影响分析
但是从另一个角度将,
创
作
门槛降低之后故事的竞争将异常激烈。
sora
openai
视频生成
工具
TTS,一个奇妙的AI工具
在自媒体盛行的今天,很多人尝试制
作
视
频
发到自媒体平台上,通过获得流量的方式实现直接或间接变现。
TTS
文本转语音
语音
栩栩如生,音色克隆,Bert-vits2文字转语音打造鬼畜
视
频
实践
本次让我们基于Bert-vits2项目来克隆渣渣辉和刘青云的声音,打造一款时下热搜榜一的“青岛啤酒”鬼畜
视
频
。
Bert-vits
语音
大模型
最强国产开源多模态大模型MiniCPM-V:可识别图片、
视
频
,还可在端侧部署
总参数量 8B,单图、多图和
视
频
理解性能超越了 GPT-4V。
minicpm
面壁
数字人
数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
以往,对口型
视
频
往往存在一个通病,那就是看似嘴型对上了,但总感觉这个声音不是他发出来的,以至于大家看对口型
视
频
的时候,会有一种割裂感。
Loopy
视频
教程
郭德纲讲英语相声详细教程
郭德纲用英文说相声的短
视
频
火爆全网,同类型的AI短
视
频
层出不穷,更有好莱坞明星说中文的短
视
频
,不断地出爆款,那么现在我们就开始学习如何制
作
一个同类型的AI短
视
频
吧!
数字人
音视频
LLM
StreamingLLM 框架:利用最新标记让 AI 记住你的话、
创
作
长篇小说,探索无限长度文本
同时研究发现,在预训练期间添加一个占位符令牌
作
为专用的注意力汇可以进一步提高流式部署的性能。
大模型
llm框架
ChatGPT
ChatGPT:12个写
作
提示词帮你覆盖所有主流写
作
场景
公众号文章
创
作
您将扮演一位公众号文章的
创
作
大师。
写作
创作
提示词
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英语
在音
频
驱动的
视
频
生成领域,制
作
普通话
视
频
面临着许多挑战。
JoyHallo
数字人
开源模型
VividTalk:用一张照片和一段音
频
让人物栩栩如生地说话
最新的突破来自VividTalk项目,这是一个能够将单张照片和一段音
频
结合起来,
创
造出仿佛真人在说话的
视
频
的技术。
VividTalk
视频
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100