my本地部署及使用教程

OCRmyPDF 提供了多种安装方式,具体取决于你的操作系统和需求。

1. 通过系统包管理器安装

Debian/Ubuntu:

Fedora:

macOS (Homebrew):

Windows Subsystem for Linux:

2. 使用 Python pip 安装

如果你需要安装最新版本或系统包管理器提供的版本较旧,可以使用 pip:

或者,使用 pipx 来创建隔离的 Python 环境:

3. 使用 Docker 安装

如果你使用 Docker,可以通过以下命令安装 OCRmyPDF 的 Docker 镜像:

运行时可以将输入和输出文件挂载到容器中:

4. 从源代码安装

如果你需要从源代码安装(例如开发或测试最新功能),可以克隆 GitHub 仓库并安装:

依赖项

Python 3.10 或更高版本

Ghostscript 9.54 或更高版本

Tesseract 4.1.1 或更高版本

jbig2enc 0.29 或更高版本(可选,用于优化输出文件大小)

pngquant 2.5 或更高版本(可选,用于优化 PNG 图像)

unpaper 6.1 或更高版本(可选,用于清洁图像)

注意要点

32 位支持:OCRmyPDF 不支持 32 位系统,建议使用 64 位版本。

Windows 用户:建议使用 Windows Subsystem for Linux 或 Docker 来避免兼容性问题。

macOS 用户:可以通过 Homebrew 安装,但需要额外安装 Tesseract 的语言包(如 tesseract-lang)。

验证安装

安装完成后,可以通过以下命令验证 OCRmyPDF 是否安装成功:

1. 添加 OCR 文本层

核心功能:为扫描的 PDF 文件添加可搜索的文本层,使文档内容可复制、可搜索。

示例命令:

2. 多语言支持

功能描述:支持超过 100 种语言,用户可以根据文档的语言选择合适的语言包,提高 OCR 的准确率。

示例命令:

3. 图像优化

功能描述:优化 PDF 中的图像,包括调整分辨率、压缩图像大小等,生成更小的文件,同时保持图像质量。

示例命令:

4. 纠偏和清洁

功能描述:在执行 OCR 之前,对图像进行纠偏(纠正倾斜)和清洁(去除污点、噪点等),提高 OCR 的准确率。

示例命令:

5. 自动旋转页面

功能描述:自动检测页面的方向并旋转页面,确保所有页面的方向一致,便于阅读和处理。

示例命令:

6. 转换为 PDF/A 格式

功能描述:将输出文件转换为 PDF/A 格式,这是一种国际标准的归档格式,适合长期存储。

示例命令:

7. 去除重复页面

功能描述:自动检测并去除 PDF 中的重复页面,减少文件大小。

示例命令:

8. 背景去除

功能描述:去除 PDF 页面中的背景,使文字更加清晰,便于阅读。

示例命令:

9. 生成 PDF/A 格式

功能描述:生成符合 PDF/A 标准的文件,适合长期归档和存储。

示例命令:

10. 跳过已 OCR 的页面

功能描述:如果 PDF 中某些页面已经包含文本层,可以跳过这些页面,避免重复处理。

示例命令:

11. 自定义 DPI

功能描述:可以指定 OCR 处理时的图像分辨率(DPI),默认值为 300 DPI。

示例命令:

12. 转换为单色图像

功能描述:将彩色或灰度图像转换为单色图像,减少文件大小。

示例命令:

13. 生成日志文件

功能描述:生成详细的日志文件,便于调试和记录处理过程。

示例命令:

14. 批量处理

功能描述:结合脚本或命令行工具(如 GNU Parallel),可以批量处理多个 PDF 文件。

示例命令:

15. 支持多种输入格式

功能描述:支持从多种格式的文件生成 PDF,包括 TIFF、PNG 等。

示例命令:

16. 压缩 PDF

功能描述:在 OCR 处理后,可以进一步压缩 PDF 文件,减少文件大小。

示例命令:

17. 转换为 PDF/A-2b 或 PDF/A-2u

功能描述:生成符合 PDF/A-2b 或 PDF/A-2u 标准的文件,适合不同需求。

示例命令:

18. 支持 Unicode

功能描述:支持 Unicode 字符,确保多语言文档的正确处理。

示例命令:

19. 自定义输出文件名

功能描述:可以自定义输出文件的名称,便于管理和识别。

示例命令:

20. 支持命令行参数

功能描述:通过命令行参数,可以灵活配置 OCRmyPDF 的各种功能。

示例命令:

上一篇

下一篇

一个给开发者用的在线学习和比赛平台,用游戏的方式帮人提升编程水平...

一个通过玩乐的力量学习编程和AI的在线编程学习平台,它用游戏化方...

一个免费的在线拼图网站,直接打开TheJigsawPuzzles...

一个为Windows用户打造的视觉美化社区和素材下载平台。这里专...

全球首个专业动画创作平台,通过多个智能模块协同工作,实现从创意到...

扣子空间的这个PPT功能可以一句话生成完整ppt,从大纲、设计到...

一个能直接生成图片和视频的工具平台,把Sora、Veo、Seed...

Math is Fun 的中文版本,它致力于用简单有趣的方式教大...

一个反向图像搜索和面部识别的搜索引擎。你在它上面上传一张清楚的人...

THE END
0.PDF页面有些倾斜,如何纠正?使用完整版Acrobat,进行ocr时,会自动顺帶校正画面倾斜。另外也可以使用ABBYY的图片处理功能,可选择画面倾斜调整,字行水平校正,和梯形校正。不用谢 赞(2) 回复 三彩 (交浅言深,君子所戒) 楼主 2013-09-09 10:44:27 使用完整版Acrobat,进行ocr时,会自动顺帶校正画面倾斜。另外也可以使用ABBYY的图片处理功能,jvzquC41yy}/fxzdcp4dqv4itq{q1}trke555<9:77?0
1.通过AdobeAcrobatProDC自动调整PDF文件的角度本文介绍如何使用Adobe Acrobat Pro DC中的工具来自动纠正PDF文档中页面的角度,并提供了详细的步骤指导。此外,还介绍了如何利用该软件的其他功能进行PDF文件优化。 首先,安装Adobe Acrobat Pro DC 并打开。 打开需要调整角度的文档: 打开之后在左上角选择“工具”中的“优化PDF”。 jvzquC41dnuh0lxfp0tfv8jfycxeaƒhn1cxuklqg1fkucrqu13782?:;48
2.利用Acrobat及Photoshop纠正PDF倾斜页面职场利器1——利用Acrobat及Photoshop纠正PDF倾斜页面工作中经常会遇到PDF页面倾斜的情况,利用利用Acrobat及Photoshop可以方便地予以纠正。下面讲一下具体做法:1、用Acrobat打开PDF文件,找到倾斜页面;2、依次点击Acrobat菜单栏<工具>、<高级编辑工具>、<Touchup对象工具>,鼠标变成箭头右下方带小方框;3、右击鼠标,在跳出的jvzquC41ddy/kwxvtwsfp}3eqo4dp8yqrki08B5649?
3.PDF文档怎么旋转页面,简单的操作技巧PDF文档怎么旋转页面呢?使用PDF文档的人也是越来越多,看到PDF文档中有一些页面出现了角度的问题,导致整个页面是倾斜的,这个时候我们需要将PDF文档中的倾斜页面进行调整旋转,下面小编就为大家操作一下PDF文档旋转页面的操作技巧。 操作软件:迅捷PDF编辑器 1:找到一款软件,打开软件,在软件的下面找到打开更多文件,将自己需jvzquC41o0ypj~3eqo5b1;<648:92>d322682@:91
4.中晶扫描仪A3自动馈纸彩色双面扫描仪附平板用户使用手册.pdf台扫描时,可以用来自动纠正倾斜图像或准确检测出扫描文档大小。 高速扫描 可扫描对折文档、信封、多层转印纸 要扫描对折文档、信封和多层转印纸,扫描仪需要装备有用于将模式切扫描仪概要 换到手动/单张进纸模式的进纸模式切换开关。手动/单张进纸模式减 少放在进纸器上的文档的负荷,使得文档可以顺利进入、成功扫描。 LCD如何放置文档jvzquC41oc~/dxtm33>/exr1jvsm1;5471663@4:35;22>5522682?;0ujzn
5.PDF纠正扫描图像倾斜软件(APDFDeskew)v3.5.4免费版下载现在让 A-PDF Deskew 来帮你矫正,一秒钟即可完成。Deskew打开一个PDF档案和查,如果图像里面斜自动,然后正确提供了一个快速的方法来纠正倾斜扫描图像。即使多个文档,也可以一次完成。如何使用:添加文件或者文件夹纠正图像 应用介绍 现在让 A-PDF Deskew 来帮你矫正,一秒钟即可完成。Deskew打开一个PDF档案和查,如果图jvzquC41yy}/h}|0eun1|thv1=98:90jvsm
6.APDFDeskew怎么用APDFDeskew好不好使用技巧A-pdfDeskew是一款可以纠正PDF页面倾斜的软件,在制作一些扫描版的PDF文档时,可能由于纸张歪放等原因导致制作的PDF的页面倾斜,很影响页面美观与阅读体验,软件可以快速解决PDF页面倾斜的问题, 并支持多文件批量处理,无需为PDF页面倾斜问题而重新扫描。 A-PDF Deskew 软件特性 jvzquC41zkg{cr3|qn4dqv3ep1hbktj156<45?3ujvsm
7.pdf文件如何旋转任意角度?在“优化扫描的PDF”的设置窗口中,如果你想要纠正倾斜的PDF页面,记得在“纠偏”设置中选为“开”。 这样操作后,原本歪斜的PDF页面就会被调整为端正的页面了! 其次,利用裁剪功能可以去除多余区域。 纠正后,图片可能会自动填充一些黑边或白边,如果你不喜欢,可以进行裁剪。 jvzquC41yy}/{xtlkc4dqv4cum52966683<3:;;428<:7;=7624ivvq
8.扫描版PDF处理优化人工智能要将扫描版PDF中的文本内容优化处理到接近完美的状态,通常需要进行一系列图像处理和OCR(光学字符识别)jvzquC41cuq/e|ip0pku1zzguvopp|4:33827B
9.[故障处理]扫描设置BPM9082D1007当原稿倾斜或原稿中的图象倾斜时,会自动校正倾斜状态并保存数据。 工厂默认设置: 禁用 条件设置 默认回复地址设置 如果执行扫描到E-mail时,在发送设置中没有指定[回复到],机器会使用保存在此处的信息。 工厂默认设置: 禁用 密件抄送设置 启用密件抄送如果您想使用密件抄送传送,请启用此设置。在图象发送地址簿屏jvzquC41yy}/uqftr0io1|nvgu5egofwnv5gkuju1wvmqjiu1qtmkwj/octvcu2dy1io1ltpvgtuuh62/2=`29:0jvsm
10.adobereaber7.0调整歪的pdf2. 浏览并选择需要调整歪斜的PDF文件,并点击“打开”按钮。3. 在打开后的页面中,点击工具栏顶部的“jvzquC41cuq/|xq0eqs/ew4z14;12;=450nuou
11.自动修正倾斜照片的有哪些APP推荐自动修正倾斜照片的有哪些下载豌豆荚自动修正倾斜照片的有哪些榜单为您提供最新自动修正倾斜照片的有哪些大全,这里不仅有自动修正倾斜照片的有哪些安卓版本APP、历史版本应用下载资源,还有类似自动修正倾斜照片的有哪些的应用推荐,欢迎大家前来豌豆荚下载。jvzquC41yy}/yjsfqwpjc7hqo1hbppicp19:3B:21
12.PDF去水印|Coding的痕迹观察PDF 文件中的水印:每页底部均有红色文字水印,可选中,意味着是文本元素。 某些页面含有文字背景水印,如: 还有一些页面包含少量灰色的图片水印,由于现在找不到了,这里略过。总的来说,这套 PDF 文件中有两种文字水印和一种图片水印,水印图片的大小在 1000 * 1000 以下,那么我的思路就是以页为单位,导出所有 10jvzq<84uwptzujg0ep532;712853;8Hngct.Yjygtogsm|2Htqs.RMK1
13.用来存档的PDF文件扫描歪了,影响大吗?如果你的文档扫描后出现了倾斜,别担心,很多PDF处理软件都提供了纠偏功能,可以轻松帮你解决这个问题。纠偏,顾名思义,就是纠正页面的倾斜度,让它恢复正常的阅读视角。 Acrobat这款软件里,你只需要在工具中查找“优化扫描的页面”,然后在弹出的窗口里找到“滤镜”下的“编辑”选项,勾选“纠偏”并点击“确定”就可以jvzquC41o0pqsnc0eun1jwvkerf1B5469?42A65::745=<50jznnHktqoettlBdklo`vjg
14.扫描图像倾斜校正软件(APDFDeskew)电脑版下载2025最新下载服务协议见页面底部 基本简介 A-PDF Deskew是一款用于纠正扫描图像倾斜的工具,可以校正图像倾斜一秒钟即可完成。使用Deskew打开图像,如果图像有倾斜现象,可以点击快速纠正倾斜扫描图像。支持批量处理多个图像。 相似软件 版本说明 软件地址 WinFIG 绿色版 jvzq<84yyy4ppunpgfuxp7sgv1yph}4;:59267mvo
15.PDF智能助手下载PDF图像辅助工具集v2.2.77、文件合并(pdf、图片格式合并成pdf,小文件夹合并等) 8、黑彩分离(挑出黑彩打印节约成本及自动统计数量极快) 9、图纸分离(挑出同类大小批量打印、或统计数量) 10、图纸统计(不分离文件直接统计数量,结果保存至桌面) 11、文本纠偏(扫描文件倾斜纠正,存档、美观、及打印) 12、图纸纠偏(同上) 13、一键转蓝(矢量、图片类型文件一键转蓝图用于打印) 软件截图 玩家点评(00 违jvzquC41fn44fvlcog4dqv4rcvii1::368
16.PDF智能助手破解版PDF智能助手v2.3.4.0离线和谐版7、文件合并(pdf、图片格式合并成pdf,小文件夹合并等) 8、黑彩分离(挑出黑彩打印节约成本及自动统计数量极快) 9、图纸分离(挑出同类大小批量打印、或统计数量) 10、图纸统计(不分离文件直接统计数量,结果保存至桌面) 11、文本纠偏(扫描文件倾斜纠正,存档、美观、及打印) jvzquC41yy}/yxiqyp4dqv4uqhz05@5:60nuou
17.PDF智能助手v2.0.8PDF智能助手官方下载导出图片(将pdf页面内尺寸导出为图片格式) 文件合并(pdf、图片格式合并成pdf,小文件夹合并等) 黑彩分离(挑出黑彩打印节约成本及自动统计数量极快) 图纸分离(挑出同类大小批量打印、或统计数量) 图纸统计(不分离文件直接统计数量,结果保存至桌面) 文本纠偏(扫描文件倾斜纠正,存档、美观、及打印) jvzquC41uqlu0
18.如何在Illustrator中导入AdobePDF文件如果您有疑问,或者希望分享观点,请加入Adobe Illustrator 社区。我们很乐意倾听您的心声并欣赏您的创意作品。 法律声明|在线隐私政策 在Illustrator 中精确设计 使用为创意自由和精确度而打造的矢量图形工具,让您的创意变为现实。 打开该应用程序 共享此页面 jvzquC41nggsp7ffqdk/exr1ep5jnuzuvtguq{4wukth1rrrqtzjpp2rfh3gkuju0jznn
19.PDF智能助手和谐版在线下载导出图片(将pdf页面内尺寸导出为图片格式) 文件合并(pdf、图片格式合并成pdf,小文件夹合并等) 黑彩分离(挑出黑彩打印节约成本及自动统计数量极快) 图纸分离(挑出同类大小批量打印、或统计数量) 图纸统计(不分离文件直接统计数量,结果保存至桌面) 文本纠偏(扫描文件倾斜纠正,存档、美观、及打印) 图纸纠偏(同jvzquC41o09eopfog0ipo8xqhv546<=860nuou
20.PDF智能助手v2.0.8免费安装版7、文件合并(pdf、图片格式合并成pdf,小文件夹合并等) 8、黑彩分离(挑出黑彩打印节约成本及自动统计数量极快) 9、图纸分离(挑出同类大小批量打印、或统计数量) 10、图纸统计(PDF智能助手不分离文件直接统计数量,结果保存至桌面) 11、文本纠偏(扫描文件倾斜纠正,存档、美观、及打印) jvzquC41uqlu0‚zwep4dqv4c15>92>3jvor