首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· Math.now
· GPT4o.so
· Westlake - Omni:西湖心辰推出的全球首个开源的中文情感端 - 端语音交互大模型
· 了解Kimi必看的26个问题 | Kimi系列文(二)
· 技术爆炸!AI一图换脸新王者,Instant ID保姆级安装与使用测评
· 豆包MarsCode——免费AI编程助手
· GitHub星数暴涨,AIPC的开源实现,用AI记录电脑一整天的使用太简单了,功能非常多!
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
LLM
2023年LLM如何入门?请看这篇综述!
实例格式化是指将数据实例(如文本、图像、
音
频等)处理成一种特定的格式,以便它们可以被用于机器学习算法的输入。
大模型
ChatGPT
什么是ChatGPT?
比如还有识别类的(Congnition):人脸识别,车牌识别这些,还有语
音
识别,文字识别各种识别任务。
ChatGPT
OpenAI
大模型
RAG
2023检索增强生成技术(RAG)研究进展
7.2、多模态扩展 RAG 的技术和概念正在不断进化,它们将如何扩展到图像、
音
频、视频或代码等其他数据形式?
RAG
检索增强
人工智能
人工智能训练的灾难性遗忘以及解决方案
在这个数字化时代,我们每天都在与人工智能(AI)打交道,从智能语
音
助手到自动驾驶汽车,从智能医疗设备到智能家居,AI已经深入到我们生活的各个角落。
人工智能
大模型
ChatGPT
PHP提示词技巧,全方位精调ChatGPT复杂任务生成效果!!!
冲突:他与忽视民众需求、专注于自身争论的政府官员发生冲突,试图让政府听到民众的声
音
。
大模型
大模型
图解大模型训练之:张量模型并行(TP),Megatron-LM
七、实验效果与GPU利用率 八、参考 顺便,Megatron,变形金刚反派队伍霸天虎首领,现任环球影城脱口秀演员(啊不是),没有它就凸显不出擎天柱们的战绩,没有它就没有变形金刚电影,我曾经的暑假快
乐
就要少很多
开源模型
大模型
垂直领域大模型的思考
虽然2023年以来几乎很多公司都发出了自己的通用大模型,但是都还停留在“开放闲聊”阶段,这种泛娱
乐
的方式是不能带来实际生产力的。
垂直领域
大模型
FaceFusion参数详解
(2.3.1)Source 指定一个或多个源图像/
音
频(
音
频用于嘴型同步) 用法: -s 或者 --source 比如: --source image1.jpg --source
FaceFusion
文生图
大模型
预训练对话大模型深度解读
,不过创始人为Transformer和LaMDA的作者,估值超过10亿美元,是角色扮演类聊天机器人,主要功能包含: 与AI扮演的角色自由聊天 通过定义角色描述自由创建角色 通过声
音
、
Fastwhisper + Pyannote 实现 ASR + 说话者识别
Audio from common.error import ErrorCode model_path = config["asr"]["faster-whisper-large-v3"] # 测试
音
频
faster-whisper
语者识别
ASR
Stable Diffusion
Meta发布业界最强文生图模型CM3Leon,实力碾压Stable Diffusion、Midjourney
今天,我们正在展示CM3leon(发
音
像“chameleon”),这是一个进行文本到图像和图像到文本生成的基础模型。
文生图
AIGC
300天里,我帮你踩遍了AIGC创业的各种坑
典型案例包括某
音
博主李某某,以及知识星球各种AI群。
AIGC
创业
你的下一个浏览器,可以是豆包电脑版!
他指出,之所以快主要有三点原因: § 其一,在产品设计层面,豆包着重多模态的打造,特别是语
音
方面,这极大地提升了用户的输入速度与便捷性; § 其二,无论是通过智能硬件设备还是电脑版,豆包都能更紧密地贴近用户场景
豆包
浏览器
OmniVision - 968M:小巧精悍的视觉语言模型,释放多模态边缘计算强大潜能
例如,通过摄像头识别用户的手势、表情等视觉信息,结合用户的语
音
指令或手机输入的文本信息,模型能够理解用户的意图,从而控制灯光的开关、调节家电的运行状态、调整室内温度等。
OmniVision
-
968M
多模态模型
OpenAI
OpenAI的官方Prompt工程指南详解 - 看这一篇真的就够了!
最后,我们可以让大模型使用自己的分析来以
乐
于助人的导师的角色构建回复。
OpenAI
Prompt
提示词
<
...
27
28
29
30
31
32
33
34
35
36
>
1
2
4
5
6
7
8
9
100