首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· BaiChuan百川
· 【TTS语音克隆开源最强王者】5款爆火开源模型(Fish、F5、GPT、CosyVoice、MaskGCT)效果对比,等你来评!
· 惊艳推荐!8款好用又免费的文本转语音TTS工具
· SDXL Styles:七十七种绘画风格任你选择
· MiniCPM 4.1 开源!代码、数学推理速度快了 3 倍!
· 语音识别的新拐点:OLMoASR 带来的机会
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 这个数字人开源项目太牛了,非常全面的项目解决方案(含源码)
· 入坑必看:comfyui界面与基础操作
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
SDXL
总结些SDXL出人像时遇到的困难
这次正好在实践中学习,先不管什么章法,直
接
看图说话就行了,后面再逐渐总结出规律。
文生图
SDXL
腾讯
AI助手App“腾讯元宝”已上线应用商店
您可以随时与元宝发起对话,元宝会通过强大的模型和搜索能力给您精准的答案,搜答案,搜资料,搜灵感,一问即达,信息搜索更轻松 【AI解析,要点直达】 元宝支持多类型的文件、图片识别及阅读,用户可直
接
上传文件
腾讯元宝
OpenAI
两天star量破千:OpenAI的Whisper被蒸馏后,语音识别数倍加速
OpenAI 认为使用这样一个庞大而多样的数据集,可以提高模型对
口
音、背景噪音和技术术语的识别能力。
语音
HeyGen
AI撬开小县城的万元商机
一些原来开设在大城市的AI工作室和公司,也主动下沉,对
接
当地的商家,打造AI模特、AI听书、AI陪聊等各种新颖产品。
AI
商机
自动化神器Autolt:不再重复工作
窗
口
和控制管理 还可以对窗
口
进行移动、隐藏、显示、调整大小、激活、关闭等几乎所有您想要的操作。
RPA
自动
ChatGPT
ChatGPT「火」烧到游戏行业,有人用其设计关卡、撰写文案、激活NPC,这会给游戏行业带来什么改变?
至于直
接
植入游戏内,据我所知,这东西是需要在线的,并非所有的玩家都好这
口
。
大模型
chatGPT
大模型
中文通用大模型最全汇总
同时我们也考虑更为快速的中文适配方案:Chinese-LlaMA2-sft-v0: 采用现有的开源中文指令微调或者是对话数据,对LlaMA-2进行直
接
微调 (将于近期开源)。
大模型
开源模型
AI探索-我怎么使用Kimi Chat的
下面是我目前在用的几个场景:读论文AI进步飞快,各种新鲜论文也
接
踵而来,对于这些未知或者我不熟悉的领域,我用它帮助我逐步理解论文中的一些论点。
KimiChat
写作
如何用大语言模型构建一个知识问答系统
基础模型(Foundation Model[3]),面向特定领域不能直
接
应用,因为领域知识不在预训练的数据集中,比如: 较新的内容。
知识库
第一性原理以及第一性原理是怎么帮马斯克成为首富的
马斯克要求工程师质疑这些规格要求,这后来成为他五步工作法当中的第一步,在公司内部这一步被称为“质疑”,这也是他开发产品时的
口
头禅。
马斯克
商业
Stable Diffusion
stable diffusion 远端跑图—— Api基础知识掌握
· 使用一个可视化http请求工具,我推荐postman,postman下载 (当然,你也可以直
接
写代码进行访问
文生图
api
大模型
为什么Llama2大模型可以在个人电脑上部署 ?
船长本着好东西必须体验一波的精神,立马去官网申请了下载模型的链
接
。
开源模型
大模型
AI Agent:大模型与场景间的价值之桥,但不适合当纯技术看
这类描述再加上AutoGPT这些开源项目提供的各种
接
口
定义,对于不是做这个的人很容易就把AI Agent理解成又一项纯粹的技术,但其实并不是。
大模型
RAG
2023检索增强生成技术(RAG)研究进展
RAG 目前面临的挑战,我们考虑如下几个方面: · 上下文长度:当检索到的内容过多,超出了模型处理的窗
口
限制
RAG
检索增强
开源
GPT-4o实时语音方案提供商Livekit开源voice agent:轻松处理音视频流
运行代理 该框架公开一个 CLI
接
口
来运行代理。
voice
agent
开源
音视频
<
...
22
23
24
25
26
27
28
29
30
31
...
>
1
2
4
5
6
7
8
9
100