首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· AI创作 |如何通过GPT进行漫画视频的故事改写
· 【Agent专题】Agent架构设计:智能体架构设计的9大核心技术全景深解析,附架构图
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
· 6个最佳开源TTS引擎
· 7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
中本聪的Web3之路
NFT是指一种基于区块链的不可替代的数字资产,它可以代表任何独一无二的事物,如艺术品、
音
乐、视
频
、域名、收藏品等。
token
比特币
加密货币
大模型
中国大模型融资暗战:罗曼蒂克的快速消亡
多位接近闫俊杰的人士表示,“闫俊杰是典型的技术宅,说话声
音
小,可能并不擅长对外”,所以平时公司对外融资、以及一些管理、外部活动也通常由贠烨祎负责。
大模型
暗战
RAG
RAG检索增强技术在知识库智能检索场景下的应用实践
其次,由于知识库的更新
频
率较低,导致所获取的信息往往已经过时,无法满足实际应用的需求。
知识库
RAG检索增强
Fastwhisper + Pyannote 实现 ASR + 说话者识别
Audio from common.error import ErrorCode model_path = config["asr"]["faster-whisper-large-v3"] # 测试
音
频
faster-whisper
语者识别
ASR
大模型
大模型与游戏结合的一个思路
目前这类游戏主要都是靠鼠标和键盘来操作,有了ChatGPT这种能够“理解”自然语言的人工智能大模型,那么完全可以通过自然语言来进行所有操作,比如命令某支部队去到什么地方,直接用文字就可以了,就如同你给部队下达的命令电报,甚至可以是语
音
,
人工智能
游戏
Prompt
让 AI 更懂你的 Prompt 提示词宝藏网站-FlowGPT
在图像生成、视
频
生成方面,提示词更是重中之重,甚至可以称得上是差之毫厘,谬以千里。
prompt
提示词
FlowGPT
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
2.77亿参数、1340万帧视
频
训练数据,背后蕴含着怎样的技术秘密?
Agent+GPT-4V
大模型
Stable Diffusion
硬核解读Stable Diffusion(系列二)
文生图 根据文本生成图像这是文生图的最核心的功能,下图为SD的文生图的推理流程图:首先根据输入text用text encoder提取text embeddings,同时初始化一个随机噪
音
noise
StableDiffusion
文生图
MCP服务介绍及应用场景报告-来自Manus
智能备份建议:基于文件的重要性和使用
频
率,AI可以提供个性化的备份建议。
MCP
大模型
Stable Diffusion
Stable Diffusion教程:采样器
后向扩散时,Stable Diffusion 先会生成一张完全的噪
音
图,然后根据提示词的语义,通过不断的采样来去除噪
音
图中不符合语义的噪
音
,而采样器就是去除噪
音
用的算法程序。
画图
SD
采样器
大模型
链接大模型与外部知识,智源开源最强语义向量模型BGE
语义向量模型(Embedding Model)被广泛应用于搜索、推荐、数据挖掘等重要领域,将自然形式的数据样本(如语言、代码、图片、
音
视
频
)转化为向量(即连续的数字序列),并用向量间的“距离”衡量数据样本之间的
embedding
语义向量
大模型
GitHub狂飙3万star的LLM公开资料 - 大模型入门教程
资源: 3Blue1Brown - 线性代数的本质:一系列视
频
,为这些概念提供了几何直觉。
LLM
大模型
GitHub
开源
Giraffe:世界上第一个商业可用的32K长上下文开源LLM(基于Llama-2)
· · 通过幂缩放 RoPE 的傅立叶基,使得低
频
比高
频
拉伸得更多。
开源模型
开源
书生·万卷:难得的中文开源数据集
书生·万卷这个语料库,包含文本数据集、图文数据集、视
频
数据集三部分,数据总量超过2TB。
大模型
数字人
AI数字人:重构人货场的新力量
一、AI数字人的定义和发展 AI数字人是指通过计算机技术创造的具有人类外貌特征、行为举止和语
音
表达的虚拟存在形式。
数字人
AI
商业
<
...
18
19
20
21
22
23
24
25
26
27
...
>
1
2
4
5
6
7
8
9
100