首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 人工智能训练的灾难性遗忘以及解决方案
· SoFlu软件机器人
· AI时代,如何利用ChatGPT一分钟洗稿一篇文章?
· SD入门教程二:文生图基础用法(提示词)
· 垂直领域大模型的思考
· 微信为什么使用 SQLite 保存聊天记录!
· ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
· 令人惊艳的开源图标生成AI模型:ChartLlama (南洋理&腾讯)
· 惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
· 深入探讨:Agent全自动写作长篇小说技术原理解析
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Fastwhisper + Pyannote 实现 ASR + 说话者识别
官方仓库:https://github.com/SYSTRAN/faster-whisper 二、pyannote.audio介绍 pyannote.audio是一个用Python编写的用于扬
声
器
faster-whisper
语者识别
ASR
大模型
大模型应用发展的方向|代理 Agent 的兴起及其未来(上)
感知模块扩展了代理的感知空间,从文本到多模态空间,包括
声
音
、视觉、触觉、嗅觉等多种感官模式。
大模型
LLM
2023年LLM如何入门?请看这篇综述!
· 高质量的语料库也很重要,低质量的语料库可能会引入噪
声
和错误,对LLM的性能产生负面影响。
大模型
ChatGPT
麦肯锡专家都在用的方法:用ChatGPT速览用户研究领域的 50 个核心概念
用户研究 Think Aloud 出
声
思维
用户
工作
大模型
大模型的研究新方向:混合专家模型(MoE)
随着不同应用场景的实际需求,大模型的参数会变得越来越大,复杂性和规模不断的增加,尤其是在多模态大模型的开发中,每个数据集可能完全不同,有来自文本的数据、图像的数据、语
音
的数据等,包含不同的模式,特征和标注之间的关系可能也大有不同
MoE
大模型
换脸
Roop升级版FaceFusion换脸AI技术使用以及部署教程
免责
声
明 在使用他人面部图像前,用户必须得到相关人士的同意,并在发布内容时不得隐瞒它是深度伪造。
FaceFusion
教程
开源
世界上最流行(github排名高)的开源移动机器人的操作系统ROS开源了!!
此外,TurtleBot3还支持语
音
识别和语
音
合成技术,可以与人进行自然语言交互,完成特定任务。
ROS
机器人
开源模型
大模型
国产编程大模型CodeGeex
声
明、描述、解答分别用红、绿、蓝色标注。
编程
大模型
大模型能力快速测评极简题目
猜谜语:埋在奴家心底,打一字 请告诉我以下陈述是否包含时代错误:在盟军轰炸硫磺岛海滩期间,拉尔夫大
声
地对着自己的 iPhone 说话 请问下列哪个事件引起了另一个事件?
大模型
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
扩散模型通过一个数学上的可靠框架,利用 U-Net 技术将噪
声
转化为图像,这一过程中,U-Net 通过预测和减少每步的噪
声
来帮助这一转换。
Sora
微软
FaceFusion参数详解
(2.3.1)Source 指定一个或多个源图像/
音
频(
音
频用于嘴型同步) 用法: -s 或者 --source 比如: --source image1.jpg --source
FaceFusion
文生图
大模型
国内AI大模型已近80个,哪个最有前途?
就像贾里尼克几十年前说的,每开掉一个语言学家,语
音
识别率就上升了。
大模型
数字人
划重点!全网最全AI数字人工具合集!
· 选择语
音
:输入文字或录制语
音
,让数字人“说出”你想让他/她表达的内容。
AI
数字人
ComfyUI
【ComfyUI】使用ComfyUI玩SDXL的正确打开方式
确保打开,添加噪
声
。
开源模型
Agent
深度好文,Agent盛行前传
Agent试用和搭建方法 笔者在一个社群中收到的推荐,体验了一款agent生成和使用服务,MindOS,如果是自己搭建,需要选择
声
音
风格、形象等,还可以搭建自己的团队,添加市场中的其他
Agent
大模型
<
...
12
13
14
15
16
17
18
19
20
21
...
>
1
2
4
5
6
7
8
9
100