首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI写作:如何写出逻辑清晰,结构完整的文章?一个提示词帮你搞定!
· Suno音乐新手指南(手把手完整版教程)
· Stable Diffusion WebUI v1.8.0重大更新!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· 赛博牛马,智谱 AI,悄悄出了一个 AI PPT
· TTS它又来了!OpenVoice:一款借鉴于TTS实现的强大的AI语音克隆工具!
· 剪映专业版智能补帧
· 大模型:泛化即智能,压缩即一切
· 一个令人惊艳的图片高清化重绘神器:SUPIR来了!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
【全文翻译】微软166页论文解读 GPT-4V:多模态大模型的黎明
在本节的接下来的实验中,我们将使用多个选定的
视
频
帧作为输入,以测试模型在理解时间序列和
视
频
内容方面的能力。
多模态大模型
GPT-4V
文生图
对于AI,我们现阶段可以有的态度
Diffusion,但依然还有搭档配合,让我们能在其他模态和领域得以探索和交流,除了AI绘画之外,我们在大语言模型和本地化部署ChatGLM,声音克隆、虚拟数字人直播间以及效果不输于D-ID的口播式
视
频
文生图
ComfyUI
解放AI生产力——为什么要使用ComfyUI
可能有一些知道AI绘画的人会说利用图生图降低噪声强度,减少修改的范围,只修改你要修改的部分就行了,(或者使用蒙版,意思是一样的)在这里我可以和你说,在关于这个方法的
视
频
发出来的几个月前我就试出来了这种方法
文生图
开源
clone-voice:一键克隆声音,开源AI技术让声音创作更便捷、更个性化
这一步就像是为后续的分析和处理搭建好了基础框架,确保音
频
数据能够以合适的形式被模型所接受,为特征提取做好充分准备。
clone-voice
声音克隆
工具
20个常见AI绘画工具大汇总(含免费版哦~)
NUWA NUWA(Neural visUal World reAtion)是微软亚洲研究院开发的多模态模型,通过自然语言指令,NUWA可以实现文本、图像、
视
频
之间的生成、转换和编辑。
文生图
大模型
中文版开源Llama 2同时有了语言、多模态大模型,完全可商用
LinkSoul.AI 团队接下来的工作会把语音 -
视
觉 - 文本进一步融合,让大语言模型同时支持语音和
视
觉模态。
开源模型
写作
提高写作能力的90个prompt大全
轻松的语气:“为介绍[您的产品]的短
视
频
制作一个有趣的脚本。”
prompt
写作
深入浅出:大语言模型中必不可少的技术——Embedding简介
如何生成和存储Embedding 总结 Embeddings技术简介及其历史概要 在机器学习和自然语言处理中,embedding是指将高维度的数据(例如文字、图片、音
频
)
embedding
生成式AI与大语言模型的区别
例如,一个图像生成模型可能会在数百万张照片和绘画的数据集上进行训练,以学习构成各种
视
觉内容的模式和特征。
生成式AI
大语言模型
区别
Stable Diffusion
张嘴就能生图?这已经不是科技,这是魔法!(Stable Diffusion进阶篇:SDXL-Turbo)
真的是一秒生成(这比我登录英雄联盟还快): 当然也可能是因为我的显卡比较好(没钱冲阿里云会员了不然我可以试试其他的显卡),但是我看了大多数的
视
频
基本上比较普遍的显卡都是在4-5秒左右就能生成。
SDXL-Turbo
文生图
语音
「语音转换新速度」— 探秘Whisper JAX的70倍速提升
这意味着它能够同时处理多个音
频
片段,大幅缩短了从语音到文本的转换时间。
Whisper
语音识别
Mixtral 7B 官宣免费,一大波 AI 模型也免费了,有网就能用!
没有精心编辑过的 Demo
视
频
,也没有长长的介绍博客,只有简单直接的磁力下载链接,背后是高达 87G 完整的模型文件。
开源
大模型
ChatGLM
ChatGLM3在线搜索功能升级
pip install -U duckduckgo_search 然后修改原来的注册脚本 其他的内容和原来的一样,下面让我们来详细体验下: 当然DuckDuckGo还支持
视
频
ChatGLM3
搜索
数字人
开源!数字人资源大集合!
· 慕尼黑工业大学 (TUM)
视
觉计算机实验室,由Matthias Nießner 教授及其团队设计。
数字人
开源
大模型
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
资源: 3Blue1Brown - 线性代数的本质:一系列
视
频
,为这些概念提供了几何直觉。
LLM
大模型
GitHub
<
...
14
15
16
17
18
19
20
21
22
23
...
>
1
2
4
5
6
7
8
9
100