gImageReader – 在 Linux 中从图像和 PDF 中提取文本

gImageReader 是一款免费的开源 PDF 阅读器，能够从图像和 PDF 中提取文本。它被构建为Tesseract-OCR的简单Gtk/Qt前端，这是一个开源OCR引擎，用于识别文档和图像中的文本和模式，使用 人工智能

就其本身而言，Tesseract 是一个命令行工具，仅限于对终端足够熟悉的Linux 用户使用。感谢gImageReader，现在每个人都可以利用引擎的OCR效率。

gImageReader 通过扫描 PDF 或图片文件中的文本来工作，由于存在 Unicode 字符，它支持多种语言中的任何一种.它具有一个简单、组织良好的可自定义用户界面，您可以通过它执行拼写检查和翻译任务。

gImageReader易于使用，支持处理软拷贝文档以及上传媒体的快照，例如截图。您甚至可以选择您感兴趣的文本区域，并且只选择您需要的文本。最终，gImagereader既是PDF阅读器又是文本提取工具。愚蠢的东西。

为了充分使用gImageReader，您必须手动安装Tesseract 语言包，以便您可以正确分析图像和文件。该软件包名为“Tesseract-ocr-eng”，可从Debian 的软件管理器中获取。和Fedora 发行版。

如果你正在运行Ubuntu，你可以简单地添加PPA并使用以下命令运行安装命令：

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo 更新
$ sudo apt 安装 gimagereader

关于Debian、Fedora和 OpenSUSE从包管理器安装。

$ sudo apt install gimagereader
$ sudo dnf 安装 gimagereader
$ sudo zypper 安装 gimagereader

如果您正在运行Arch Linux或其任何衍生产品，请不要感到被冷落。 AUR让您满意。如果您更愿意从源代码重建应用程序，说明位于其 GitHub 存储库 Wiki 链接中。

你会从图像中提取印刷文本吗？您甚至可以使用手机拍摄选定区域的快照并将其上传到笔记本电脑。更酷的是它的多语言支持——虽然不完美，但已经是目前社区中最好的选择之一。

gImageReader 是开源世界中最好的 PDF 阅读器之一，尤其是它的 OCR 功能，所以试试看吧你喜欢吗。

和往常一样，如果您有任何使用该应用程序的经验，欢迎与我们分享。并在下面的评论部分添加其他建议。

辅导孩子的最佳编程工具