数据挖掘通常涉及通过多个GB大小的文件搜索文件,这些文件不适合通过脚本进行快速筛选。 Jalatext(30美元,30天免费试用版)是一款旨在帮助您查看,搜索和编辑此类文件的工具,并且可以快速完成。
Jalatext以Java编写,可以打开非常大的(1 gig +)文件几乎立即。疯狂地试图尽可能地将尽可能多的文件放入RAM中,而不是一次加载一小部分,保持性能迅速。用户可以根据其可用RAM调整已加载段的大小
Jalatext可以非常快的速度在16GB文件周围导航。加载Jalatext后,您可以按段进行导航。如果您告诉它一次加载10,000行,则每次点击相应的控件将移至下一个/前一个10,000行。或者通过在细分中滚动。你也可以快速地到文件的开始/结尾
这指出了Jalatext的一个问题,也就是说,这并不容易告诉你在文件中的相对位置。
Jalatext的状态栏告诉你正在显示的字节范围,但不是行号,这对于许多目的来说非常有用。滚动条告诉你在加载段中看到的相对位置,这很好,但很少提供对文件本身位置的快速,直观的了解。如果您知道您感兴趣的区域是100万行中的234,500行,则没有“转到此行”功能或命令。
有一件事可以减轻这一点,即使用书签。 Jalatext允许您在文件中标记位置,并在它们之间快速移动。您还可以导出书签之间的所有文本,这在尝试提取大量数据时非常方便。当结合正则表达式(正则表达式,如果你需要像Jalatext这样的程序,你可以知道它们是什么,或者你需要学习)启用搜索功能,这可以启用很多导航快捷键。
然而,我在大文件中搜索时,Jalatext已经冻结。我通过减少选择使用的文件段的大小来解决这个问题。
Jalatext还能够以不同的编码保存文件,当将大文件从一个操作系统移动到另一个操作系统时,它们可以被较新或较旧的程序读取,而不是那些输出它们的文件,这种情况经常发生。
不利的一面是,Jalatext没有任何能力来识别分隔文件并以更容易阅读的格式显示数据。分隔符(通常是逗号或制表符分隔)文件是最常见的大文件类型之一,这对未来的扩展很有用。
Jalatext做了一项专门的工作,并且做得很好,骨头为$ 30价格。 30天的试用版没有功能限制,所以任何人都有充足的时间进行测试并得出自己的结论。
注意:
“产品信息”页面上的“免费试用”按钮可让您供应商的网站,您可以在其中下载适用于您的系统的最新版软件。