首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· GenColor.ai
· 为你推荐开源项目:Meridian——专属个人情报站!
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· AI换脸工具:facefusion使用心得
· 变天了,AI可以一键生成中文海报了......
· 详解Stable Diffusion提示词prompt语法
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 大模型中的Top-k、Top-p、Temperature详细含义及解释
· 企业数字化转型的“阿里阿德涅之线”在哪?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
Prompt
Prompt及AI提问实践
写在前面 在大模型
技
术
应用越发广泛的大背景下,各行各业都在尝试落地。
Prompt
大模型
提问
Sora
中学生也能看懂的Sora视频生成原理解读
在古代遗迹的机机 首先,Sora通过一个叫做“视频压缩网络”的
技
术
,将输入的图片或视频压缩成一个更低维度的表示形式,这一过程类似于将不同尺寸和
分
辨率的照片“标准化”,便于处理和存储。
视频生成
sora
数字人
腾讯出品!开源AI数字人框架!号称可以不限时长
如今数字媒体和虚拟现实
技
术
飞速发展,对数字人的需求不断增加!
MuseV
视频
数字人
框架
AI颠覆的第一个体育赛道,来了
Plaier平台的核心优势在于其能够实时
分
析
全球比赛和球队数据,并与转会市场上的球员联系起来,为足球经理人提供定制化的转会建议。
体育
AI
教程
AI声音克隆 | 最全最简教程(权威版)
它是一种将文本内容转换为语音的
技
术
,通过TTS
技
术
,计算机可以将文字信息转换成人类可听懂的语音输出,实现语音合成的功能 目前市场上的AI声音 我们最多用的还是普通的
声音克隆
教程
开源
构建开源多模态RAG系统
这篇文章探索和了解如何创建一个高效的RAG系统,结合ChromeDB和Hugging Face等开源
技
术
在大型语言多模态应用中的力量。
RAG
大模型
通义千问
阿里AI黑科
技
大揭秘:从通义千问到FaceChain,让图片和视频焕发新生!
Step 2: 补充对视频内容的英文文本描述,然后点击“生成高
分
辨率视频”,视频生成大致需要 2
分
钟。
阿里云
视频
音频
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
通过使用Transformers和Optimum
技
术
,可以在不到10
分
钟内转录300
分
钟(5小时)的音频。
音频
Whisper
ChatGLM
清华大学ChatGLM团队发布AI Agent能力评测工具AgentBench:GPT-4是全能战士,超越所有模型
但是,现实问题涉及了许多超越LLM外的能力,比如为用户提供实时数据
分
析
和可视化结果、为软件开发提供一条龙服务等。
GPT-4
ChatGPT
什么是ChatGPT?
它通过
分
析
和理解人类输入的问题或文本,并生成相应的回答或文本。
ChatGPT
OpenAI
大模型
开源
3 个令人惊艳的 GitHub 开源项目,诞生了!
各种 AI 工具层出不穷,无数网友惊叹
技
术
进步之快。
开源模型
开源
无显卡+纯本地跑Qwen1.5版模型!0基础闭眼部署指南!适用绝大部
分
开源模型!llama2+Mistral+Zephyr通杀!
人的专注力只有10
分
钟,那,话不多说!
Qwen1.5
开源模型
大模型
从零开始学习大模型-第二章-大模型学习路线
随着
技
术
的进步,大模型如OpenAI的GPT-4和Sora、Google的BERT和Gemini等已经展现出了惊人的能力-从理解和生成自然语言到创造逼真的图像及视频。
大模型
学习
开源
字节开源项目MimicTalk:快速打造逼真3D Talking Face的利器
随着数字人
技
术
的发展,生成高度逼真的「3D说话头像」(3D Talking Face)成为了一种趋势。
MimicTalk
开源模型
开源
昆仑万维携Skywork-13B打造AI新纪元:600GB中文数据集全球开源
引言 在人工智能的浪潮中,数据和算力是推动
技
术
发展的两大驱动力。
Skywork
开源
数据
<
...
16
17
18
19
20
21
22
23
24
25
...
>
1
2
4
5
6
7
8
9
100