首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Suno音乐新手指南(手把手完整版教程)
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 高效选择:Ollama与LM Studio深度对比
· 「长文」可能是目前最全的LangChain AI资源库之一
· CodeGeeX
· PostgreSQL的三位一体——在大模型应用中结合关系型、向量和时间序列数据
· ChatLaw
· 一个产品经理的大模型观察、反思与预测
· ChatGPT「火」烧到游戏行业,有人用其设计关卡、撰写文案、激活NPC,这会给游戏行业带来什么改变?
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
中文开源OCR框架对比及介绍
为了让
计
算机更快的、更好地进行OCR相关
计
算,我们需要先对彩色图进行处理,使图片只剩下前景信息与背景信息。
OCR
大模型
中文通用大模型评测基准发布,全方位解析评价维度,助你选出最优秀的模型!
基础能力: 包括了常见的有
代
表性的模型能力,如语义理解、对话、逻辑推理、角色模拟、
代
码
、生成与创作等10项能力。
大模型
训练
中文
LangChain 完整指南:使用大语言模型构建强大的应用程序
Prompt Template 有助于将用户输入和其他动态信息
转
换为适合语言模型的格式。
langchain
大模型
懒人福音!用AI生成会议纪要,让你的工作更高效!
通义听悟主要聚焦于音视频内容,提供多种功能,包括实时语音
转
写、音视频文件
转
写、实时翻译、内容标记和智能全文概要等。
会议纪要
AI工具
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的 AI Avatar
它主要通过堆叠ID嵌入方式编
码
任意数量的输入ID图像,以保留ID信息。
PhotoMaker
文生图
大模型
无限逼近真人效果的“超真实人像大模型”,或许它才是你一直在寻找的真爱!
项目主页-https://snap-research.github.io/HyperHuman/ 论文链接-https://arxiv.org/abs/2310.08579
代
码
链接-https:/
大模型
文生图
视频
Wunjo AI: 合成和克隆英语/俄语/中文语音,实时语音识别,深度换脸和唇动合成,通过文本提示更改视频,分割和修饰
主要特征 语音合成:轻松将文本
转
换为类似人类的语音。
AI语音克隆
实时语音识别
RAG
RAG检索增强技术在知识库智能检索场景下的应用实践
提示工程要求对模型的预测方式有深入了解,以便
设
计
出能够有效激发模型潜能的提示。
知识库
RAG检索增强
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上
芯片在执行
计
算任务时需要经历两个阶段:数据传输和
计
算,数据传输花费时间过多,
计
算“空载”,就会造成算力的浪费。
芯片拼接
芯片拼接技术:英伟达新核弹,站在苹果的肩膀上!
芯片在执行
计
算任务时需要经历两个阶段:数据传输和
计
算,数据传输花费时间过多,
计
算“空载”,就会造成算力的浪费。
芯片拼接技术
AIGC
AIGC的7个黑暗面
下一波
计
算将涉及AIGC,可能会出现在工作流程的几个地方,趋势将是势不可挡的。
大模型
开源
GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
项目简介 ScreenPipe 在你的
计
算机上 7*24小时 全天候记录你的电脑屏幕和麦克风,数据由用户自行掌控,确保隐私和安全,并且把记录的数据连接到大模型
AIPC
ScreenPipe
开源
开源
构建开源多模态RAG系统
实时更新和依赖权威来源减少了决策过程中灾难性损失、监管问题或
代
价高昂的错误的可能性。
RAG
大模型
DALL-E 3 不只是文生图!10 个案例颠覆认知
我希望这些可视化
设
计
能帮助您将企业活动的愿景变为现实!
DALL-E
3
文生图
Fastwhisper + Pyannote 实现 ASR + 说话者识别
-> 122.90s] 一方面我们当初刚好从2014年刚好开始要出去的时候国内就是三个北上广深但在海外要同时开服北美 美东 美西 欧洲 日本我还记得那个时候我们在海外如何去建立这种IDC的康碳建
设
基础
设
施建
设
云服务的部署那都是一个全新的挑战
faster-whisper
语者识别
ASR
<
...
42
43
44
45
46
47
48
49
50
51
...
>
1
2
4
5
6
7
8
9
100