1.【文】鲲鹏916-ARM64架构源码gcc编译完整记录
2.Python操作PDF的神器——PyMuPDF
【文】鲲鹏916-ARM64架构源码gcc编译完整记录
以下是关于ARM架构源码gcc编译的详细步骤记录: 首先,确保已经准备就绪,如果cmake未安装,需要进行安装。检查cmake版本以确认其是否满足需求。 安装必要的栏目源码依赖包,如isl、gmp、mpc、mpfr等,检查它们是否已成功安装。 针对gcc版本过低的多人博客源码问题,需下载并更新到7.3版本。下载并解压gcc7.3的安装包。 在gcc-7.3.0目录下,确认已下载和安装了所有依赖包。 利用多核CPU的优势,通过“-j”参数加速编译过程。原先是按照官方文档使用make -j,但速度缓慢,后来调整为make -j以提升效率。 依次执行编译目录创建、gcc编译、api网站搭建源码安装以及确认“libstdc++.so”软连接在正确的目录(/usr/lib)。 编译完成后,通过查看gcc版本来确认安装是否成功。 以上就是完整的gcc编译安装流程。如果您觉得这些信息对您有所帮助,欢迎分享和关注我们的更新。更多技术内容敬请期待,感谢您的支持!Python操作PDF的神器——PyMuPDF
一、PyMuPDF简介
PyMuPDF 是 MuPDF 的 Python 接口,MuPDF 是spring源码分析书一个轻量级的 PDF、XPS 和电子书查看器。MuPDF 支持多种文档格式,如 PDF、XPS、OpenXPS、CBZ、EPUB 和 FictionBook 2。PyMuPDF 使用户可以访问扩展名为 ".pdf"、".xps"、".oxps"、".cbz"、名片赞商城源码".fb2" 或 ".epub" 的文件。此外,它还可以处理约种流行的图像格式,如 ".png"、".jpg"、".bmp"、".tiff" 等。
二、安装
PyMuPDF 可以从源码或 wheels 进行安装。对于 Windows、Linux 和 Mac OSX 平台,在 PyPI 的下载部分有 wheels。它支持 Python 3.6 到 3.9 的 位版本,Windows 版本也有 位版本。对于 Linux ARM 架构,查找 manylinux_aarch 标签。
除了标准库外,PyMuPDF 没有强制性的外部依赖项。安装某些包时,需要 Pillow(用于 PixMap 的 pil_save() 和 pil_tobytes())和 fontTools(用于 Document.subset_fonts())。PyMuPDF-fonts 是一个不错的字体选择,用于文本输出。使用 pip 安装命令:pip install PyMuPDF。
三、使用方法
1. 导入库,查看版本
2. 打开文档
创建 Document 对象 doc,文件名必须是存在的 python 字符串。也可以从内存数据打开文档或创建新的空 PDF。文档还可以用作上下文管理器。
3. Document 方法和属性
| 方法/属性 | 描述 |
| ------ | ------ |
| Document.page_count | 页数 (int) |
| Document.metadata | 元数据 (dict) |
| Document.get_toc() | 获取目录 (list) |
| Document.load_page() | 读取页面
示例:获取元数据、目标大纲。
4. 页面处理
页面处理是 MuPDF 功能的核心。您可以将页面呈现为光栅或矢量(SVG)图像,选择缩放、旋转、移动或剪切页面。您可以提取多种格式的页面文本和图像,并搜索文本字符串。对于 PDF 文档,可以使用更多的方法向页面添加文本或图像。
创建页面 Page,使用 Document 的方法。
页面常用操作包括检查链接、批注或表单字段、呈现页面、保存页面图像、提取文本和图像、搜索文本。
5. PDF 操作
PDF 是唯一可以使用 PyMuPDF 修改的文档类型。其他文件类型是只读的。但是,您可以将任何文档(包括图像)转换为 PDF,然后将所有 PyMuPDF 功能应用于转换结果。通常,您可以选择是保存到新文件,还是仅将修改附加到现有文件(“增量保存”),这通常要快得多。
操作 PDF 文档包括修改、创建、重新排列和删除页面,连接和拆分 PDF 文档,保存和关闭文档。