首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Suno音乐新手指南(手把手完整版教程)
· SD入门教程二:文生图基础用法(提示词)
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· videomaker.me
· Flowith:革新你的工作方式,体验节点式 AI 的超流畅生产力
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· AI生成卡通人物项目|VToonify
· AI写作:如何写出逻辑清晰,结构完整的文章?一个提示词帮你搞定!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
大模型
大模型推理能力增强方法总结
CoT 做的就是这件事,示例如下: 简单来说,语言模型很难将所有的语义直
接
转化为一个方程,因为这是一个更加复杂的思考过程,但可以通过中间步骤,来更好地推理问题的每个部分。
推理能力
大模型
Sora
微软研究团队:Sora核心技术及未来机会研究报告-中英对照版
具体而言,Sora 首先将视频数据压缩到一个更低维度的潜码空间中,
接
着再将这些数据分解为时空
片
段(Spacetime Patches)。
sora
论文
大模型
大模型微调经验汇总---LLM finetuning 踩坑经验之谈
作者:FelixCoder 链
接
:https://zhuanlan.zhihu.com/p/639462205 一、前言 由于 ChatGPT 和 GPT4 兴起,如何让人人都用上这种大模型
大模型
人工智能
语音
国内厂商语音识别与Whisper评测:现状与概况对比
国内的科技企业在语音识别领域也在不断迭代和创新,其中不乏一些具有竞争力的语音识别技术,如讯飞、百度、阿里巴巴等,这些厂商的技术在一定程度上已经
接
近或达到了国际领先水平。
语音识别
Faster-Whisper
大模型
北大开源最强aiXcoder-7B代码大模型!聚焦真实开发场景,专为企业私有部署设计
要知道,AI编程工具当前最实用的能力就是生成和补全,包括直
接
生成完整的方法块、条件判断块、循环处理块、异常捕捉块等多种情况。
aiXcoder-7B
大模型
Transformer
Transformer速查宝典:模型、架构、训练方法的论文都在这里了
所有内容均按照重要性和独特性进行排序,并将链
接
附在下方。
Transformer
Transformer
ViTPose+:迈向通用身体姿态估计的视觉Transformer基础模型
带有transposed卷积上采样和预测层的标准解码器(c)和直
接
使用双线性插值的简单解码器(d)被用于评估简单视觉transformer的简单性;用于Bottom-up预测的解码器(e)也被采用来衡量
ViTPose+
Transformer
身体姿态
大模型
大模型能自己优化Prompt了,曾经那么火的提示工程要死了吗?
举个例子,有一个 prompt 就是直
接
把《星际迷航》的说话风格搬过来了:「指挥官,我们需要您绘制一条穿过这股湍流的路线并定位异常源。
prompt
大模型
提示
DALL-E 3 不只是文生图!10 个案例颠覆认知
DALL-E 3 的出现又一次颠覆了 AI 绘图行业,它生成的图
片
迅速走红社交媒体。
DALL-E
3
文生图
大模型
炸裂!百川开源第1个7B多模态大模型 Baichuan-Omni | 能够同时分析图像/视频/音频/文本
在此阶段,作者实现了一种打包技术,将多个样本
拼
接
在一起,使用flash-attention2的cq_len进行有效的样本隔离。
Baichuan-Omni
多模态大模型
懒人福音!用AI生成会议纪要,让你的工作更高效!
该产品还能与阿里云盘账号绑定,方便直
接
读取和转写存储在云盘中的音视频文件。
会议纪要
AI工具
大模型
Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
此外,端到端的设计是它的一大亮点,这种设计直
接
从文本输入生成语音输出,无需繁琐的中间环节,极大地提高了语音合成的效率和准确性。
Westlake
-
Omni
语音
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
具体而言,Sora 首先将视频数据压缩到一个更低维度的潜码空间中,
接
着再将这些数据分解为时空
片
段(Spacetime Patches)。
Sora
微软
Agent
LangChain Agent 原理解析
它提供了一套工具、组件和
接
口,可以简化创建由 LLM 和聊天模型提供支持的应用程序的过程。
大模型
如何使用 Megatron-LM 训练语言模型
Transformers 3 还支持使用 Trainer API 来训练,其在 PyTorch 中提供功能完整的训练
接
口,甚至不需要自己编写训练的代码
开源模型
<
...
23
24
25
26
27
28
29
30
31
32
...
>
1
2
4
5
6
7
8
9
100