首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· 最新最强开源模型Qwen3本地运行指南!Windows+ollama+chatwise轻松搞定
· 不会PS也能做神图?豆包AI绘画全解析,让你的创意秒变艺术品!
· 为你推荐开源项目:Meridian——专属个人情报站!
· 本地部署Manus+DeepSeek保姆级教程!
· 数字人起飞!字节Loopy对口型功能在即梦上线 可根据语境匹配表情和情绪
· Stable Diffusion 30种采样器全解
· 大模型评测新思路:弱智吧精华问题大全
· 掌握Prompt的6心法
· 从 GPT-4o 到 LiveKit:实时语音交互的开源实现
· MaskGCT:登上GitHub趋势榜榜首的TTS开源大模型
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
开源
研究
人
员开源中文文本嵌入模型,填补中文向量文本检索领域的空白
值得关注的是,目前,M3E 模型中使用的
数
据集、训练脚本、训练好的模型、评测
数
据集以及评测脚本都已开源,用户可以自由地访问和使用相关资源。
GPT
语音
Insanely Fast Whisper:超快的Whisper语音识别脚本
通过使用Transformers和Optimum
技
术
,可以在不到10分钟内转录300分钟(5小时)的音频。
音频
Whisper
pdf2htmlEX:效果相当好的一个PDF转HTML程序,和原始PDF几乎一模一样。
其背后是利用的Chrome Headless,让Chrome渲染PDF,再导出成HTML,甚至图片都转成了 base64
字
符,所以一个网页就可以包含完整的文本、
字
体和图片等内容 这是我的
PDF转换
开源
世界上最流行(github排名高)的开源移动机器
人
的操作系统ROS开源了!!
此外,TurtleBot3还支持语音识别和语音合成
技
术
,可以与
人
进行自然语言交互,完成特定任务。
ROS
机器人
开源模型
OpenAI
马斯克怒告OpenAI案解密:Ilya看到了什么?125万亿参
数
Q*细节曝光,53页PDF全网疯转
虽然在大多
数
人
看来,这并不是什么令
人
印象深刻的事,但这的确是朝向AGI迈出的一大步,堪称重要的
技
术
里程碑。
OpenAI
大模型
StableDiffusion
AI绘画由入门到精通:StableDiffusion精讲课程
随着
人
工智能
技
术
的发展,Stable Diffusion作为一款强大的文生图软件已经引发了全球范围内的创作革命。
SD
视频课程
AI绘画
一网打尽 | 掌握64个策划思维模型,逆转职业寒冬!(高清图+模型详解)
技
术
因素(Technology):有高新
技
术
、工艺
技
术
和基础研究的突破性进展。
策划思维模型
方法论
开源
几款开源的OCR识别项目,收藏备用
goncalopp/simple-ocr-opencv.git OCR工具 OCRmyPDF OCRmyPDF是基于tesseract-ocr开发、训练的文
字
识别提取的开源项目
OCR
开源
OCR是什么以及推荐几款开源中文OCR识别软件
二值化: 如今
数
码摄像头拍摄的图片大多是彩色图像,彩色图像所含信息量巨大,不适用于OCR
技
术
。
OCR
从⼤模型到 AI 应⽤落地,工程实现有多复杂?
众所周知,⼤模型代表了⼈⼯智能
技
术
的前沿发展。
大模型
Sora
微软对 Sora 进行了逆向工程分析,揭秘 Sora 的秘密
文章首先回顾了 Sora 的开发历程,探索了支撑这一“
数
字
世界构建者”的关键
技
术
。
Sora
微软
ChatGPT
使用 ChatGPT + Claude 撰写成功的商业计划书
以下是广泛分析中的一些要点:在
技
术
和个性化的推动下,预计将实现快速增长。
工作
阿里
阿里通义实验室薄列峰:从兵马俑跳“科目三”到照片唱歌,四大框架让AI生成的
人
物活起来丨GenAICon 2024
采用Video2Motion,基于视频
人
物动作驱动3D
数
字
人
;
人
物唱演视频生成框架Emote Portrait Alive能够基于单张图和音频,输出准确、生动的
人
物唱演视频。
通义
文生视频
赚钱
你还在为钱发愁?2023年十大赚钱GPT Prompts高级指南!(国际版)
而你所做的,只是运用ChatGPT等AI工具的
技
术
。
prompt
开源
阿里巴巴语音实验室发布开源语音处理框架ClearerVoice-Studio,支持语音增强、分离、目标说话
人
提取
虽然音频
技
术
日新月异,但许多现有方案在复杂场景中仍难以提供稳定且高质量的音频体验。
ClearerVoice-Studio
语音
<
...
32
33
34
35
36
37
38
39
40
41
...
>
1
2
4
5
6
7
8
9
100