gImageReader 是一款免费的开源 PDF 阅读器,能够从图像和 PDF 中提取文本。它被构建为Tesseract-OCR的简单Gtk/Qt前端,这是一个开源OCR引擎,用于识别文档和图像中的文本和模式,使用 人工智能
就其本身而言,Tesseract 是一个命令行工具,仅限于对终端足够熟悉的Linux 用户使用。感谢gImageReader,现在每个人都可以利用引擎的OCR效率。
gImageReader 通过扫描 PDF 或图片文件中的文本来工作,由于存在 Unicode 字符,它支持多种语言中的任何一种.它具有一个简单、组织良好的可自定义用户界面,您可以通过它执行拼写检查和翻译任务。
gImageReader中的功能
gImageReader易于使用,支持处理软拷贝文档以及上传媒体的快照,例如截图。您甚至可以选择您感兴趣的文本区域,并且只选择您需要的文本。最终,gImagereader既是PDF阅读器又是文本提取工具。愚蠢的东西。
在Linux上安装gImageReader
为了充分使用gImageReader,您必须手动安装Tesseract 语言包,以便您可以正确分析图像和文件。该软件包名为“Tesseract-ocr-eng”,可从Debian 的软件管理器中获取。和Fedora 发行版。
如果你正在运行Ubuntu,你可以简单地添加PPA并使用以下命令运行安装命令:
$ sudo add-apt-repository ppa:sandromani/gimagereader $ sudo 更新 $ sudo apt 安装 gimagereader
关于Debian、Fedora和 OpenSUSE从包管理器安装。
$ sudo apt install gimagereader $ sudo dnf 安装 gimagereader $ sudo zypper 安装 gimagereader
如果您正在运行Arch Linux或其任何衍生产品,请不要感到被冷落。 AUR让您满意。如果您更愿意从源代码重建应用程序,说明位于其 GitHub 存储库 Wiki 链接中。
你会从图像中提取印刷文本吗?您甚至可以使用手机拍摄选定区域的快照并将其上传到笔记本电脑。更酷的是它的多语言支持——虽然不完美,但已经是目前社区中最好的选择之一。
gImageReader 是开源世界中最好的 PDF 阅读器之一,尤其是它的 OCR 功能,所以试试看吧你喜欢吗。
和往常一样,如果您有任何使用该应用程序的经验,欢迎与我们分享。并在下面的评论部分添加其他建议。