首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 字节跳动最强AI工具 “豆包” ,近1000款应用!一句话自动生成图文,堪比ChatGPT?
· 构建开源多模态RAG系统
· 深入探讨:Agent全自动写作长篇小说技术原理解析
· GPU 性能(数据表)快速参考
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
· Examful.ai
· videomaker.me
· MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
· 一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成。
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OpenAI
【语音识别】OpenAI语音力作Whisper
与Wav2Vec 2.0等前作不同,以往的模型都是在未标注的音
频
数据上预训练的,而 Whisper 是在大量的已标注音
频
转录数据上预训练的。
语音转文字
whisper
开源
精通百种语言的翻译
AI
来了!Meta推出,免费、开源!
这个模型可以实现近101种语言之间的文本、音
频
、
视
频
等多种形式的翻译,而且只需要一个模型就可以完成所有任务。
大语言模型
开源
ModelScope(一站式开源的模型即服务共享平台)的简介、安装、使用方法之详细攻略
短
视
频
内容分类 解析短
视
频
语义进行场景分类 video-detecction
视
频
检测 对
视
频
信息进行内容解析
开源
开源
开源语音大语言模型来了!阿里基于Qwen-Chat提出Qwen-Audio!
使LLMs能够感知和理解丰富的音
频
信号以进行音
频
交互引起了广泛关注。
大模型
语音
大模型
AI
大模型LLM可以帮助企业做什么?
100 强和出海 20 强(2023年08月)》 上面这份榜单上图像
视
频
类人工智能生成的产品,在国内和出海的榜单上占据了绝大多数:占据国内前10中5个名额,出海10个中7个。
大模型
腾讯
腾讯的 PhotoMaker - 更快 更像 更可控的
AI
Avatar
这种嵌入可以被
视
为待生成身份标识的统一表示。
PhotoMaker
文生图
Stable Diffusion
免配置、免翻墙,Stable Diffusion平替来了!
LeonardoAI是一个稳定的在线平台,不仅免费,还是一款可
视
化编辑工具,操作界面对用户非常友好,在实际图像质量方面也处于目前
AI
工具的前沿。
LeonardoAI
文生图
让
AI
帮你读财报:Reportify让你看得清、聊得深
Reportify是一款帮助人们解读公司财报的
AI
分析工具。
Reportify
读财报
替代画师?不,
AI
把枪指向了商业摄影
今年以来,关于
AI
绘画是否能取代画师的争论一直喋喋不休。
文生图
人工智能
【
AI
科技大创意】2024年人工智能10大趋势
三、
AI
垂类定制、专门构建的
AI
agents 奥利维亚·摩尔 (Olivia Moore) 是消费者投资团队的合伙人,她专注于投资市场初创公司。
人工智能
趋势
如何从零开始,打造一家
AI
驱动的公司?
当前
AI
浪潮中,
AI
驱动的创业公司备受关注。
大模型
打造公司
医疗
惊艳!2.77亿参数锻造出Agent+GPT-4V模型组合,领航
AI
领航机器人、游戏、医疗革新,通用智能时代你准备好了吗?
在这里插入图片描述 注意:LangChain Agent主要增强基于语言的互动能力,而交互式代理基础模型寻求统一多模态输入,以实现更广泛的通用
AI
应用。
Agent+GPT-4V
大模型
Agent
AI
Agent的千亿美金问题:如何重构10亿知识工作职业,掀起软件生产革命?
目前有两类介入使 Agent 更可控的思路,这两类产品从不同的
视
角切入,我们认为都有未来的商业前景。
大模型
AI编程
2024年傅盛开年
AI
大课演讲内容PPT
他在近期的开年
AI
大课活动中发表的重要演讲稿,重点阐述了
AI
大模型在企业运营决策中的关键角色。
猎豹
AI
演讲
语音
字正腔圆,万国同音,coqui-
ai
TTS跨语种语音克隆,钢铁侠讲16国语言
coqui-
ai
TTS实现跨语种、无需训练克隆语音的方法是基于Tacotron模型,该模型使用了一种音素输入表示来鼓励在不同语种之间共享模型容量。
coqui-ai
TTS
语音
<
...
17
18
19
20
21
22
23
24
25
26
...
>
1
2
4
5
6
7
8
9
100