首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 为你推荐开源项目:Meridian——专属个人情报站!
· GenColor.ai
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 6个最佳开源TTS引擎
· Suno音乐新手指南(手把手完整版教程)
· AI换脸工具:facefusion使用心得
· ChatGLM智谱清言
· MCP服务介绍及应用场景报告-来自Manus
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
whisper-live:OpenAI Whisper模型的近实时实现
该项目是一个实时转录应用程序,使用 OpenAI Whisper 模型将语音输入转换为
文
本
输出。
OpenAI
Whisper
大模型
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
给定
成
对数据(a, x),其中a和x表示音
频
序列和
文
本
序列,训练目标是最大化下一个
文
本
标记的概率。
大模型
语音
被高估的Pika,被低估的多模态AI
例如,在医疗领域可以通过结合图像、录音和病历
文
本
,提供更准确的诊断和治疗方案;在交通领域,结合图像和传感器数据,带来更智能、更安全的自动驾驶体验;在教育领域,将
文
本
、声音、
视
频
相结合,呈现更具互动性的教育内容
大模型
多模态
Transformer
ViTPose+:迈向通用身体姿态估计的
视
觉Transformer基础模型
身体姿态估计旨在识别出给定图像中人或者动物实例身体的关键点,除了典型的身体骨骼关键点,还可以包括手、脚、脸部等关键点,是计算机
视
觉领域的基
本
任务之一。
ViTPose+
Transformer
身体姿态
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音
频
克隆声音的黑科技!
这一步骤确保了
文
本
与
生
成
的语音在时间和内容上的精准对应,提高了语音合
成
的准确性和连贯性。
OuteTTS-0.1-350M
音频
开源
常用的开源协议说明--一句话说明开源协议
本
质
EPL (Eclipse Public License 1.0 ) 商业软件可以使用,也可以修改EPL协议的代码,但要承担代码产
生
的侵权责任。
开源
数字人
揭秘数字人困境:代理商亏钱、直播屡被封、刘润也不用了
这是数字人底层技术的自然延伸,“从技术定位上看,数字人
本
质上是做
视
频
合
成
。
数字人
数字人
腾讯开源的数字人MuseTalk到底行不行?
MuseTaIk特别适用于256x256像素的面部区域,且支持中
文
、英
文
和日
文
等多种语言输入。
MuseTalk
数字人
音频
ChatGPT
11个非常简短却十分神奇的 ChatGPT 指令,刷新你的认知
本
文
将介绍 11 个短小精悍的提示词,让你很容易记忆并应用它们。
提示词
企业
为什么说数智化可以帮助中小企业降
本
增效 ?
数智化产品为「商铺门店、公寓酒店、楼宇园区」等场景提供智能设备组网链接、
视
频
监控、安全消防、智慧收银等集中一体化产品方案,实现「政务信息化」中在线办公、线上审批、信息公开等数字化应用的高效运转,为中小企业带来
大模型
换脸
AI换脸:FaceFusion 3.5.0更新,解决老版
本
无法使用问题!
这些模型利用深度学习技术
生
成
逼真且美观的着色效果。
FaceFusion
文生图
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
DeepFloyd IF是一个由一个冻结
文
本
编码器和三个级联像素扩散模块组
成
的模块:一个基于
文
本
提示
生
成
64x64像素图像的基础模型和两个超分辨率模型,每个模型都设计用于
生
成
分辨率不断提高的图像:256x256
大模型
文生图
如何用大语言模型构建一个知识问答系统
领域知识入库 该过程的主要目的是:将原始知识库分拆为若干知识点,并
生
成
与之对应的字典: key 是知识点 Embedding 之后
生
成
的向量 value 是知识点的原始记录 该字典的作用是用户提问时
知识库
RAG
你真的会写 Prompt ? 剖析 RAG 应用中的指代消解
,并将这些信息与 LLM 的
生
成
能力结合,从而提高
生
成
的准确性和可靠性。
Prompt
大语言模型
RAG
ChatGPT
使用ChatGPT写出优质长
文
、
文
章
掌握这些技巧,仅需5分钟即可完
成
一篇2万字的
文
章。
ChatGPT
写作
<
...
18
19
20
21
22
23
24
25
26
27
...
>
1
2
4
5
6
7
8
9
100