首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Midjourney AI绘画美女提示词分享二
· PPT又又有新突破了!智谱AI代码流造PPT
· ComfyUI安装及生成第一张图
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· ComfyUI初学者指南
· SeaTable 一站式助力高校多场景数字化升级,打造高效解决方案
· 各个语种互相翻译:Meta推出NLLB-200 AI模型,可实现200种语言互译
· Suno音乐新手指南(手把手完整版教程)
· AI换脸工具:facefusion使用心得
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V
模
型
组合,领航AI领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
在这里插入图片描述 注意:LangChain Agent主要增强基于
语
言
的互动能力,而交互式代理基础
模
型
寻求统一多
模
态输入,以实现更广泛的通用AI应用。
Agent+GPT-4V
大模型
OpenAI
向量数据库失宠了?OpenAI 力捧检索增强生成(RAG)技术,对行业来说意味着什么?
大
语
言
模
型
尽管具有所有
语
言
能力,但缺乏掌握“现在”的能力。
检索增强生成
大语音模型
Agent
深度好文,Agent盛行前传
在这篇文章里我将借助引用量较高的论文“Reward is enough”并结合近期使用的MindOS(一款以GPT为大
模
型
底层的agent应用
Agent
大模型
RAG
谈谈RAG存在的一些问题和避免方式
对于熟悉机器学习
模
型
调优的人来说会对chunk_size和top_k非常敏感,为了确保RAG系统以最佳状态运行,需要对块大
小
和top_k进行调优,以确保它们是最合适的。
RAG
大模型
ComfyUI
ComfyUI,你开启XL钥匙打开了新世界
设置
模
型
搜索路径,可以复用设备上的其他路径里的
模
型
文件。
ComfyUI
大模型
AIGC
聊聊 AIGC 一些拧巴的现状
来,一起用老
模
型
分析一下类似的项目: 1.
开源模型
开源
开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI Codex
这套新的编码
模
型
将与 OpenAI 打造的 Codex 正面抗衡,并基于 Meta 的 Llma 2 软件——这是一种能够理解并生成会话文本的大
语
言
模
型
。
开源模型
开源
清华&面壁开源新一代主动Agent交互范式!让AI从被命令到主动帮助
人类标注员在研究开发的标注平台上进行标注,对特定时间下,9 个不同的大
语
言
模
型
生成的多样化预测进行判断,并通过多数投票的方式决定某个回合用户是否具有需求,以及用户倾向于接受什么类
型
的任务。
Agent
大模型
开发
语
音产品时设计唤醒词和命令词的技巧
一个
模
型
仅允许一个唤醒词,如果需要多个唤醒词,请单独优化并使用多网络切换功能。
语音产品
唤醒词
命令词
阿里
企业数字化转
型
的“阿里阿德涅之线”在哪?
近几年,受到全球经济下行的压力,数字化转
型
成为中
小
型
企业的破局点。
大模型
用户
13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
通过优化的声学
模
型
和
语
言
模
型
,确保
语
音的自然度和准确性,使其在多种场景下都能提供高质量的
语
音输出。
Fish
Speech
本地搭建
国内厂商
语
音识别与Whisper评测:现状与概况对比
一、
语
音识别现状 二、评测意义与预期成果 三、评测方案 四、评测结果 一、
语
音识别现状 得益于近年来深度学习技术的快速发展,人工智能的主要分支(图像、
语
音、自然
语
言
处理等)都相继进入了大规
模
落地应用阶段
语音识别
Faster-Whisper
聊天大
模
型
的输出速度应该是多少?单张显卡最多可以支持多少个人同时聊天?来自贾扬清最新的讨论~
大
模
型
应用中一个非常重要的问题就是大
模
型
的响应速度。
大模型
开源
OpenAI 开源
语
音识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音识别
模
型
的软件工具,能够将音频或视频中的
语
音自动识别为带有时间戳的文本字幕。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音交互的开源实现
通过插件,LiveKit 可以与大
型
语
言
模
型
(如 GPT-4o)无缝对接,提供强大的智能对话和自然
语
言
处理能力。
GPT-4o
语音交互
<
...
37
38
39
40
41
42
43
44
45
46
...
>
1
2
4
5
6
7
8
9
100