首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 多智能体开发框架怎么选型?京东 JoyAgent vs langchain LangGraph,两种Agent开发哲学的碰撞!
· 《特朗普爱上在白宫当保洁的我》拍好了,3个月赚了10个亿
· 6.2K Star!MIT出品的多语言语音合成神器,CPU实时推理吊打商业软件!
· 汇总1400+文献的神级“上下文工程”综述,治愈初学者的AI迷失症
· ChatGPT提示词万能模板:BRTR原则,让ChatGPT完美理解你的需求
· stable diffusion API 调用,超级详细代码示例和说明
· 使用ComfyUI玩SDXL的正确打开方式
· ComfyUI的特性以及安装流程
· 数字人之声音克隆:无样本,1分钟样本完美克隆声音,开源
· 13.5K Star ! Fish Speech Windows本地搭建,能否达到官方的级别?强烈推荐
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
生成式AI领域拓展!MetaAI开源AudioCraft:一个支持AudioGen、MusicGen等
模
型
的音频生成开发框架
在过去的几年里,我们看到了AI在图像、视频和文本生成方面的巨
大
进步。
开源模型
开源
ModelScope(一站式开源的
模
型
即服务共享平台)的简介、安装、使用方法之详细攻略
提供开源数据集、开源
模
型
、
模
型
工具等,用社区的方式免费开发给广
大
个人、企业用户使用。
开源
Stable Diffusion
Stable Diffusion高级教程 - 图生图(img2img)
模
式
这个
模
式下功能很
多
我们挨个说 img2img 图生图
模
式下的默认功能,我们先看一下主界面: 上面还是正面提示词和负面提示词,接着是一个上传图片的区域,写着「Drop Image Here -
Stable
Diffusion
图生图
LLM
国内LLM陆续启动,你的Prompt库有这些
模
块吗
不管你写过
多
少提示词,对于任何一个
大
语言
模
型
,主要的交互角色只有三种:用户(User)、助手(Assistant)和系统(System)。
prompt
开源
Llama 3突然来袭!开源社区再次沸腾:GPT-4级别
模
型
可以自由访问的时代到来
8B
模
型
在MMLU、GPQA、HumanEval等
多
项基准上均胜过Gemma 7B和Mistral 7B Instruct。
meta
llama3
开源
3 个令人惊艳的 AI 文档神器,开源了!
于是,在 GPT-4 刚发布之初,其强
大
的内容总结能力,成为了被使用最
多
的功能之一。
大模型
开源模型
OCR
完全指南——使用python提取PDF中的文本信息(包括表格和图片OCR)
编写提取图像中文本的函数 编写提取表格的文本内容的函数 最后的整合处理 写在前面 随着
大
型
语言
模
型
(LLM)的应用不断发展,从简单的文本摘要和翻译,到基于情绪和财务报告主题预测股票表现
大语言模型
python
LLM
StreamingLLM 框架:利用最新标记让 AI 记住你的话、创作长篇小说,探索无限长度文本
如果
大
模
型
能够像人一样长时间对话并记住之前的内容,那么我们将拥有更广泛的应用可能性,让AI能够做更
多
事情。
大模型
llm框架
谷歌
长窗口
大
战要终结了?谷歌魔改Transformer,推出了“无限注意力”
谷歌的
大
模
型
Gemini 1.5 首先玩了一个百万token的,中国的月之暗面一个月后推出Kimi智能助手,支持200万字超长无损上下文,在中国的
大
模
型
应用中异军突起。
大模型
上下文
Meta
如何微调Meta Llama-3 8B
Meta 推出了 Meta Llama 3 系列 LLM,包括 8 和 70B
大
小的预训练和指令调整的生成文本
模
型
。
Meta
Llama
3
大模型
VividTalk:用一张照片和一段音频让人物栩栩如生地说话
VividTalk技术简介 VividTalk的核心功能是使用一张静
态
照片和音频录音,生成一个动
态
的、看似真实的讲话视频。
VividTalk
视频
ChatGLM
当ChatGLM3能用搜索引擎时
随着AIGC的发展,传统的网络搜索
模
式也在接受这前所未有的挑战,首当其冲的就是各
大
搜索引擎,比如bing在自家浏览器中搭载了chatgpt,能够根据搜索的内容进行整合,并生成逻辑清晰,而且相对准确的信息
大模型应用
大模型
ChatGLM
ChatGPT
模
拟ChatGPT流式数据——SSE最佳实践(附可运行案例)
为什么要这样传输,从使用场景上来说,ChatGPT 是一个基于深度学习的
大
型
语言
模
型
,处理自然语言需要
大
量的计算资源和时间,响应速度肯定比普通的读数据库要慢 接口等待时间过长,显然不合适。
GPT
开源
从 GPT-4o 到 LiveKit:实时语音交互的开源实现
LiveKit 不仅有一个开源的 voice agent 方案[1],还能为你提供一个成熟且强
大
的实时
多
模
态
AI 解决方案。
GPT-4o
语音交互
提示词
推荐一个自动生成复杂提示词的
模
版:思考链(CoT)如何通过分步推理提升AI任务准确性 | 示例详解
什么是思考链 (CoT) 思考链(Chain of Thought,简称 CoT)是一种推理策略,通过将复杂问题分解为
多
个简单步骤,从而提升
大
型
语言
模
型
(LLM)的推理能力。
思考链
提示词
<
...
32
33
34
35
36
37
38
39
40
41
...
>
1
2
4
5
6
7
8
9
100