首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· SD入门教程二:文生图基础用法(提示词)
· 剪映克隆声音功能详解:剪映上线5秒“AI克隆音色”,一堆AI公司又要进入慢性死亡了...
· openpose原理及安装教程(姿态识别)
· AI声音克隆 | 最全最简教程(权威版)
· 自己电脑上跑大语言模型(LLM)要多少内存?
· Github上Star数最多的大模型应用基础服务:Dify 深度解读
· 从 GPT-4o 到 LiveKit:实时语音交互的开源实现
· 结构化Prompt必备基础:5分钟学会Markdown语法,实现提示词创作自由!
· 超详细的 Stable Diffusion ComfyUI 基础教程(一):安装与常用插件
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
数字人
京东开源普通话数字人JoyHallo,一口流利标准普通话还会讲英
语
首先,收集全面的普通话数据集非常困难;其次,普通话的复杂口
型
动作使得
模
型
训练比英
语
更具挑战性。
JoyHallo
数字人
开源模型
人工智能
深度洞察:人工智能体(AI Agent)2024年重要发展趋势指南
随着
大
语
言
模
型
(LLM)驱动的人工智能体(AI Agent)的兴起,我们正处于一个新时代的边缘:人工智能体可能会形成自己的社会,与人类和谐共存。
AI
Agent
人工智能
一旦参透「第一性原理」,便洞悉所有事的本质
建议您先
大
致浏览一遍并将其收藏,以便将来实际操作时能够参照查看,一旦学会,终身受用!
第一性原理
大模型
Stable Diffusion
Stable Diffusion WebUI v1.9.0重
大
更新!
根据
模
型
时间步长(Model timesteps)而不是采样步骤(Sampling steps)进行精炼器(Refiner)切换 从原理上来讲精炼器(Refiner)会根据采样器和
模
型
的训练方式
Stable
Diffusion
文生图
大模型
AIGC
聊聊 AIGC 一些拧巴的现状
今天,整理一下我得到的一些碎片化信息和观点分享给
大
家,希望有用。
开源模型
开源
开源打败闭源?Meta即将推出开源代码生成平台Code Llama,剑指OpenAI Codex
这套新的编码
模
型
将与 OpenAI 打造的 Codex 正面抗衡,并基于 Meta 的 Llma 2 软件——这是一种能够理解并生成会话文本的
大
语
言
模
型
。
开源模型
开发
语
音产品时设计唤醒词和命令词的技巧
韵母选择
大
口
型
,开口音的韵母,比如 a、ai、an、ian、ao,避免 e、i、en、in 等; 9.
语音产品
唤醒词
命令词
开源
OpenAI 开源
语
音识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动
语
音识别
模
型
的软件工具,能够将音频或视频中的
语
音自动识别为带有时间戳的文本字幕。
生成式AI
开源
从 GPT-4o 到 LiveKit:实时
语
音交互的开源实现
LiveKit 不仅有一个开源的 voice agent 方案[1],还能为你提供一个成熟且强
大
的实时多
模
态 AI 解决方案。
GPT-4o
语音交互
AI能赚到钱了么?
最近各种
大
模
型
密集发布,“赶上GPT4”“成为中国的OpenAI”等观点散见于各种文章。
大模型
商业模式
全球学术界知名学者教授信息
大
盘点(全)
本文是学术
大
佬资料整理得合集(共计86位),他们都是自然
语
言
处理(NLP)方面得权威专家。
AI大佬
知名学者
比尔盖茨最新预
言
:AI智能体颠覆计算机交互体验甚至软件行业
这就使一种未来变得更加清晰:人人都能使用自然
语
言
开发软件、拥有多个专属私人助理,像浏览应用一样购买流行的私人助理,就像在苹果应用商店里下载App。
AI智能体
工具
惊艳推荐!8款好用又免费的文本转
语
音TTS工具
这种技术使用深度神经网络
模
型
来合成
语
音,能够更自然地
模
拟人类的发音和
语
调,从而产生更加流畅和自然的
语
音输出。
TTS
Maker
语音
RAG
检索增强生成 (RAG):What, Why and How?
例如,如果询问
模
型
关于截止日期之后发生的事件,则提供该事件作为背景信息并随后提问将帮助
模
型
正确回答问题。
检索增强
大模型
人工智能
AI产品经理视角:如何构建人工智能产品
就核心人工智能
模
型
而
言
,您可以使用三个主要选项: 提示现有
模
型
。
大模型
产品经理
<
...
42
43
44
45
46
47
48
49
50
51
...
>
1
2
4
5
6
7
8
9
100