首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 用ComfyUI整了一套照片转Q版手办的工作流
· SD入门教程三:采样器及参数调整
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Kimi+扣子Coze,我零门槛制作了一个好用的智能体Agent | 智能体开发
· 国内外开源大语言模型一览表
· Comfyui工作流原理 你都了解吗
· 借题发挥下最近几例声音克隆的应用案例
· 智谱AI官网再升级,GLM-4,智能体,AI作图长文档全部搞定!
· Suno音乐新手指南(手把手完整版教程)
· 豆包MarsCode——免费AI编程助手
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
Prompt及AI提问实践
写在前面 在大模型
技
术
应用越发广泛的大背景下,各行各业都在尝试落地。
Prompt
大模型
提问
不出所料,字节个把月就整出了自己的manus,不用积
分
,无需会员,快来体验coze空间吧
字数 1713,阅读大约需 9
分
钟 一两个月前manus开始爆火的时候,我写过下面的内容 对manus的8个评价 文兄赞一个,公众号:PeopleSoft探究内行看门道,
manus
阿里
Sora
中学生也能看懂的Sora视频生成原理解读
在古代遗迹的机机 首先,Sora通过一个叫做“视频压缩网络”的
技
术
,将输入的图片或视频压缩成一个更低维度的表示形式,这一过程类似于将不同尺寸和
分
辨率的照片“标准化”,便于处理和存储。
视频生成
sora
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
如今数字媒体和虚拟现实
技
术
飞速发展,对数字人的需求不断增加!
MuseV
视频
数字人
框架
AI颠覆的第一个体育赛道,来了
Plaier平台的核心优势在于其能够实时
分
析
全球比赛和球队数据,并与转会市场上的球员联系起来,为足球经理人提供定制化的转会建议。
体育
AI
教程
AI声音克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为语音的
技
术
,通过TTS
技
术
,计算机可以将文字信息转换成人类可听懂的语音输出,实现语音合成的功能 目前市场上的AI声音 我们最多用的还是普通的
声音克隆
教程
开源
构建开源多模态RAG系统
这篇文章探索和了解如何创建一个高效的RAG系统,结合ChromeDB和Hugging Face等开源
技
术
在大型语言多模态应用中的力量。
RAG
大模型
通义千问
阿里AI黑科
技
大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
Step 2: 补充对视频内容的英文文本描述,然后点击“生成高
分
辨率视频”,视频生成大致需要 2
分
钟。
阿里云
视频
音频
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
通过使用Transformers和Optimum
技
术
,可以在不到10
分
钟内转录300
分
钟(5小时)的音频。
音频
Whisper
ChatGLM
清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench:GPT-4是全能战士,超越所有模型
但是,现实问题涉及了许多超越LLM外的能力,比如为用户提供实时数据
分
析
和可视化结果、为软件开发提供一条龙服务等。
GPT-4
ChatGPT
什么是ChatGPT?
它通过
分
析
和理解人类输入的问题或文本,并生成相应的回答或文本。
ChatGPT
OpenAI
大模型
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
各种 AI 工具层出不穷,无数网友惊叹
技
术
进步之快。
开源模型
开源
无显卡+纯本地跑Qwen1.5版模型!0基础闭眼部署指南!适用绝大部
分
开源模型!llama2+Mistral+Zephyr通杀!
人的专注力只有10
分
钟,那,话不多说!
Qwen1.5
开源模型
大模型
从零开始学习大模型-第二章-大模型学习路线
随着
技
术
的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。
大模型
学习
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
随着数字人
技
术
的发展,生成高度逼真的「3D说话头像」(3D Talking Face)成为了一种趋势。
MimicTalk
开源模型
<
...
16
17
18
19
20
21
22
23
24
25
...
>
1
2
4
5
6
7
8
9
100