首页
Ai 资讯
Ai 知识库
创作魔法
绘画魔法
视频魔法
训练魔法
Ai术语
Ai提示词
Ai创意图
Ai工具
Ai视频
VIP专区
VIP专区
登录
AI魔法学院客服
最新
排序
收藏
全部
七天内
一个月内
选择分类
全部
写作魔法
绘画魔法
视频魔法
训练魔法
其他
AI工具
VIP视频
推荐阅读
换一批
· OCR的终极解法——传统算法VS多模态大模型
· cursor+coze智能体,一行代码没写,我撸了个小程序
· 腾讯 IMA: AI 智能教学新助手
· AI换脸工具:facefusion使用心得
· ComfyUI 图片以及工作流管理神器
· 用so-vits-svc-4.1进行音色转换的极简教程!
· 6个最佳开源TTS引擎
· 我尝试了 100 个免费 AI 工具,这些是最好的
· AI产生意识,对人类意味着什么
· 最强开源数字人对口型系统介绍
热门标签
Stable Diffusion
stable diffusion
Midjourney
midjourney
ComfyUI
comfyui
ChatGPT
chatgpt
大模型
数字人
开源
人工智能
Sora
文心一言
天工
零一万物
知海图
星火
文心一格
混元
通义千问
盘古
言犀
ChatGLM
Github
微软
热门标签
免费
教程
插件
免费
教程
插件
免费
教程
插件
文章列表
OCR
Selenium+ddddocr | 再也不担心图片验证码
ddddocr库介绍 ddddocr(Deep Double-Digital Digits OCR)是一个基于深度学习的OCR(Optical Character Recognition,光学
字
符识别
Selenium
ddddocr库
ChatGPT
模拟ChatGPT流式数据——SSE最佳实践
:
字
段名:
字
段值。
打字机
sse
大模型
RVC和SVC声音模型难找?推荐这个网站
AI声音模型训练是通过分析大量音频数据来学习声音特性,生成与目标声音相似的新音频。这包括数据预处理、模型构建、训练、评估和优化。为了达到逼真、自然的声音效果,需要大量高质量音频数据和计算资源,并且需要精细调整和优化模型。
声音克隆
数字人
LLM
让AI记住你说的话、让AI给你生成几十万
字
的小说!StreamingLLM 让无限长token成为可能
比如写一个几十万
字
的小说!
StreamingLLM
写作
ChatGPT
你是否发现ChatGPT甚至不能按
字
数要求回复问题?有人做了评测并讨论了可能的原因
Evaluating Large Language Models on Controlled Generation Tasks 你是否发现ChatGPT甚至不能按
字
数要求回复问题
大模型
控制
一个充满多智能体的数
字
社会正在浮现,商业的底层逻辑已进入重构倒计时
未来已来,一个遍布智能体的数
字
社会正在浮现。
大模型
开源
中文开源OCR框架对比及介绍
字
符切割:由于拍照、书写条件的限制,经常造成
字
符粘连、断笔,直接使用此类图像进行OCR分析将会极大限制OCR性能。
OCR
大模型
OCR的终极解法——传统算法VS多模态大模型
传统算法 一般情况 OCR 识别商务名片会分为两步: · OCR 算法识别出文
字
和坐标
OCR
大模型
文字识别
借题发挥下最近几例声音克隆的应用案例
某父亲痛失爱子,因为儿子托梦告知人是可以复活的,于是这位父亲到处寻找让人复活的办法,于是他关注到了最新的人工智能技术,开始找人咨询和学习技术,通过摸索,他知道通过ChatGPT可以训练儿子的过去的说话,文
字
等语料
声音克隆
数字人
大模型
OCR终结了?旷视提出可以文档级OCR的多模态大模型框架Vary,支持中英文,已开源!
以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗等多个步骤—— 这一次,只需一句话命令,多模态大模型 Vary 直接端到端输出结果: 无论是中英文的大段文
字
:
OCR
手写
文字识别
金融
金融行业中 Fintech 的应用场景
本
节
课开始,咱们要花几
节
课的时间来学习一下 Fintech 的数据分析。
Fintech
金融
大模型
全球最强大模型一夜易主,GPT-4时代终结!Claude 3提前狙击GPT-5,3秒读懂万
字
论文理解力接近人类
再举个例子,要求Claude 3 Opus将难以阅读的手写
字
迹的照片转换为文本。
claude
大模型
Stable Diffusion
Stable Diffusion ComfyUI 入门感受
Clip文
字
编码器
节
点,正面和负面分成两个
节
点 · Unet阶段:ksampler
节
点,负责在潜空间生成图片
文生图
神奇的 OuteTTS - 0.1 - 350M:用几秒钟音频克隆声音的黑科技!
在当今数
字
化时代,文本转语音(TTS)技术的应用愈发广泛,从智能语音助手到有声读物,从无障碍服务到教育娱乐领域,都离不开高质量的语音合成。
OuteTTS-0.1-350M
音频
大模型
大模型套壳祛魅:质疑套壳,理解套壳
从年初到年末,从百度文心一言到零一万物,从
字
节
跳动到谷歌 Gemini,各种「涉嫌套壳」的事件屡次冲上热搜,随后又被相关方解释澄清。
大模型
套壳
<
...
4
5
6
7
8
9
10
11
12
13
...
>
1
2
4
5
6
7
8
9
100