首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
· SD的老舅ComfyUI来了,节点式工作流,分部控制出图
· 什么是极限、导数、微分与积分(通俗易懂)
· Stable Diffusion 快速创作角色三视图
· Midjourney 实现角色一致性的新方法
· 用so-vits-svc-4.1进行音色转换的极简教程!
· 换脸软件 FaceFusion 保姆级教程
· GLM4 开源了!!!还有多模态
· 7.1k Star!RAGFlow:最新开源OCR+深度文档理解的RAG引擎、大海捞针测试、降低幻觉、服务化API集成进业务!
· 语音识别的未来已来:深入了解faster-whisper的突破性进展
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
AIGC
聊聊 AIGC 一些拧巴的现状
但,大多数的社群和培训,都是在教你怎么使用 AI来
创
作
。
开源模型
大模型
从零开始了解AI大模型 - 技术篇:万字深度好文人话说大模型技术
ChatGPT的惊世之举,让大家见识到通用人工智能的辉煌崛起,也让AI在文本
创
作
、摘要提炼、多轮对话甚至代码生成等领域迈向了一个质的飞跃。
大模型
AI Comic Factory:AI(连环)漫画生成器
项目目前使用Llama-2 70b
作
为LLM,有三种选项:使用Inference API模型、使用Inference Endpoint URL、或自行修改代码以使用其他LLM系统。
生成式AI
AI变现异常值案例库,5种方向10个案例,副业项目灵感启发
”(用第一人称手机拍摄屏幕) 讲AI今天又有多牛逼,又怎么怎么样了 一定程度上引发观众焦虑,然后吸引关注 东子的思考:这种
视
频
类型和账号,是目前AI账号里流量最大的可以用来快速起号,结合自己或者别人的后端产品去变现
生成式AI
万字长文-大语言模型指令调优综述
Video-LLaMA (Zhang et al., 2023b)是一个多模态框架,它增强了大型语言模型的理解
视
频
中的
视
觉和听觉内容的能力。
大语言模型
LLM
Ollama还是vLLM?深度解析四大顶级LLM服务框架:性能、特性与技术选型指南
本文将深入探讨这四个杰出开源框架的工
作
原理、核心
创
新、性能优化策略、突出特性以及各自的最佳应用场景,帮助开发者选择最适合其项目需求的工具。
LLM
服务框架
开源
OpenAI 开源语音识别 Whisper 的使用体验怎么样?
关于Buzz Buzz 是一款基于 OpenAI 开源 Whisper 自动语音识别模型的软件工具,能够将音
频
或
视
频
中的语音自动识别为带有时间戳的文本字幕。
生成式AI
开源
17K star!30秒偷走你的声音,开源声音克隆工具
OpenVoice 是什么 OpenVoice 是由AI
创
业公司 openshell 开源的一款声音克隆工具。
OpenVoice
声音克隆
开源
工具
免费文生图工具StableDiffusion喂饭级使用教程
www.bilibili.com/video/BV17d4y1C73R 星空一键整合包: https://www.bilibili.com/video/BV16j411A7BL 注:星空的东西很全,但是
视
频
讲的不是很清楚
文生图
SD
大模型
中国大模型「顶流群聊」笔记
8 月 23 号,西溪论道参会者合影看得出来,阿里云
作
为算力基础设施层应该如何与这几个层面连接与共
创
,如何支持各个层面的
创
业者做好大模型用好大模型,这是张勇最关心的话题。
大语言模型
大模型
大模型应用中大部分人真正需要去关心的核心——Embedding
向量Embedding非常灵活,包括音
频
、
视
频
、文本和图像都可以表示为向量Embedding。
大模型
开源
开源免费离线语音识别神器whisper如何安装
whisper的日常用途 whisper的核心功能语音识别,对于学生党和工
作
党来说,可以帮助我们更快捷的将会议、讲座、课堂录音整理成文字稿;对于影
视
爱好者,可以将无字幕的资源自动生成字幕,不用再苦苦等待各大字幕组的字幕资源
wisper
翻译
免费
大模型
投资人逃离大模型
依图科技:“天问”大模型是上海依图网络科技有限公司在2023年底首发的一款多模态大模型,是
视
频
监控领域内第一个商用发布的大模型产品,基于先进的Transformer架构,具有会思考、可对话、能进化的三大特点
大模型
清华
图片生成速度最高提升10倍!可以做到“实时”生成!清华推出LCM/LCM-LoRA!
近年来,随着SD和Midjourney的火热,文本到图像生成(Text-to-Image Generation)的研究取得了令人瞩目的进展,让我们能够用自然语言指导AI
创
造出各种各样的图像。
LCM/LCM-LoRA
文生图
将任意文本转换为知识图谱
这些信息通常存储在图形数据库中并可
视
化为图形结构,从而产生了知识“图形”一词。
知识图谱
转换
文本
<
...
26
27
28
29
30
31
32
33
34
35
...
>
1
2
4
5
6
7
8
9
100