首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· MidjourneyAPI
· Sara2.ai
· 你的下一个浏览器,可以是豆包电脑版!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 喂饭级 AI’MWISE 启动器安装教程
· 如何从零开始训练专属 LoRA 模型?4600字总结送给你!
· 8G显存一键训练,解锁Llama2隐藏能力!XTuner带你玩转大模型
· 用AI生成PPT、用AI优化PPT!
· 免费AI数字人制作详解
· 新模型Cascade你真的用对了吗?!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
美的数
字
化
转
型10年,方洪波的反思。作为领导者的高瞻远瞩与宽广胸襟!
那么ToC和ToB这四个板块的业务,在过去十年,都是我们同步数
字
化
转
型的。
工作
开源
腾讯开源的数
字
人MuseTalk到底行不行?
该模型能够根据输入的
音
频信号,自动调整数
字
人物的面部图像,使其唇形与
音
频内容高度同步。
MuseTalk
数字人
音频
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,
语
音
识别数倍加速
前段时间,「霉霉大秀中
文
」的视频在各个社交媒体走红,随后又出现了「郭德纲大秀英
语
」等类似视频。
语音
HeyGen
用AI轻松玩
转
年度总结PPT
这篇
文
章就是为你准备的 我会教你如何利用完全免费的国产 AI 工具,快速的制作 PPT 如果你有很多复杂的
文
字
需要整理,没问题,让 A 已帮你整理 如果你平时不喜欢总结工作内容,做了很多事,写总结不知如何下笔
PPT
年终总结
开源
OpenAI 开源
语
音
识别 Whisper 的使用体验怎么样?
Buzz
语
音
转
文
字
工具的特点 高度精确:基于 OpenAI 提供的 Whisper 自动
语
音
识别技术,这是一款功能强大的机器学习模型。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音
交互的开源实现
今天我们来聊聊OpenAI 发布会提到的实时对话
语
音
技术。
GPT-4o
语音交互
GLM-4-Voice 9B——实时多
语
言
语
音
对话 AI——几分钟内即可在本地安装
如何设置 GLM-4-Voice 9B 以实现无缝的实时
语
音
交互,支持英
语
和中
文
,并探索其独特的架构、低延迟响应和可定制的声
音
属性。
GLM-4-Voice
9B
语音
安装
Transformer
TrOCR——基于transformer模型的OCR手写
文
字
识别
前期我们使用大量的篇幅介绍了手写数
字
识别与手写
文
字
识别,当然那里主要使用的是CNN卷积神经网络,利用CNN卷积神经网络来训练
文
字
识别的模型。
OCR
手写
文字识别
阿里
阿里&
字
节发表VividTalk,只需单张照片即可根据
音
频生成栩栩如生的人物说话头像视频
只需提供一张人物的静态照片和一段
语
音
录
音
,VividTalk即可制作出一个看起来像是实际说话的人物的视频。
VividTalk
视频
大模型
语
言大模型100K上下
文
窗口的秘诀
在
语
言模型中,上下
文
窗口对于理解和生成与特定上下
文
相关的
文
本至关重要。
大模型
OCR
【重磅推荐】PaddleOCR:超越人眼识别率的AI
文
字
识别神器!
导
语
:在当今数
字
化时代,人工智能技术已经渗透到各个领域。
PaddleOCR
文字识别
请以“亮相”为题目写一篇记叙
文
,要求不少于700
字
。
文
心一言: “亮相”是一个瞬间,一个舞台上的演员在掌声雷动中,优雅地走到台前,向观众鞠躬致意,展示自己的风采。
中文
大模型
训练
开源
Chinese-LLM开源中
文
大
语
言模型合集
-6B 简介:一个开源的,支持图像、中
文
和英
文
的多模态对话
语
言模型,
语
言模型基于 ChatGLM-6B,具有 62 亿参数;图像部分通过训练 BLIP2-Qformer 构建起视觉模型与
语
言模型的桥梁
大模型
中文
提示词
18种 DALL-E 3 炫酷的
文
字
效果和提示词
DALL-E 3 不仅可以在图片上生成
文
字
,还可以把
文
字
巧妙地融合到图像中。
DALL-E
3
提示词
文生图
RAG
图解检索增强式生成(RAG)技术 | 万
字
长
文
3、假设性问题和 HyDE 另一种方法是让 LLM 为每个
文
本块生成一个问题,并将这些问题
转
化为向量。
检索增强式生成
RAG
<
1
2
3
4
5
6
7
8
9
10
...
>
1
2
4
5
6
7
8
9
100