首页 资料 正文

OpenRefine2.6下载 OpenRefine(数据清洗工具) v2.6 for Linux 官方免费版(附使用教程) 下载-

2025-04-07 06:59:27 1

OpenRefine v2.6 for Linux版是一款非常简单易用的专业数据优化和清洗工具,所谓的数据清洗就是检查数据库中无用和错误的地方然后进行修正,支持残缺数据、错误数据以及重复数据的搜索和清洗,旨在提高数据库的结构化和规范化,小编还为大家带来了OpenRefine的安装和使用教程供大家参考,需要此款工具的朋友们欢迎前来下载使用。

安装方法

1、OpenRefine在Windows的安装

下载ZIP包

解压到某个目录;

要运行OpenRefine,双击openrefine.exe文件。

2、OpenRefine在Mac的安装

下载DMG文件

打开磁盘镜像,拖动OpenRefine的图标到Applications目录;

双击图标以启动OpenRefine。

3、OpenRefine在Linux的安装

下载gzipped包

解压到当前用户的home目录;

在终端命令行环境,键入./refine以启动OpenRefine。

使用说明

首先我们得载入数据文件

打开Open Refine, 点击屏幕左侧的“新建项目” (Create Project)

先点击“这台电脑” (This Computer),然后点击“选择文件”(Choose Files)。 在你的数据文件中选择UniversityData.csv。你就会看到数据。

该文件中有些中文文字(列的名字)。如果中文显示不对,你也许需要告诉Open Refine使用正确的字符集。要做到这一点,点击“字符编码” (Character encoding) 旁边的空白空间,从中选择UTF-8。

然后点击右边的“新建项目” (Create Project) 键。

你可以看到country (“国家”)这一列中, 国家名字不统一。例如,美国即叫 United States,也叫USA。我们要通过创立一个文字归类, 让Open Refine 给我们看 country 一列中所有的值。摁下 country 旁边的小下箭头,选择 归类 Facet -> 文本归类 Text Facet。

片刻后,该归类中所有国家的值就会在屏幕左侧显示出来。

你可以看到美国有多个不同叫法, 还有一些错误的名字,比如有一行美国叫United States ), 还有一个捏造的国家叫Utopia(乌托邦)!每个不同的国家名叫一个归类, Open Refine 给你显示了每一个归类里有多少行数据。

点击任何归类名字,你会只看到那个归类里的行。在我们这个例子里,你只会看到那些国家列里数据和你点击的名字相符的行。

你只要点击任何一个归类名,就能对其进行编辑。现在我们来把美国所有不同的叫法都变成United States。 你鼠标指向 US 这一归类时,一个的“编辑”edit 选项就会出现。点击该 编辑 edit。

请打入United States, 然后点击 应用 Apply。

现在所有是 US 的2609行都变成了United States。 对每一个别的叫法都同样进行编辑,直到美国所有的叫法都变成United States。 你做完后,你的归类应该如下:

登录下载
-六神源码网 -六神源码网