在 Linux 命令行中格式化输出 xml

我们先前分享过一篇关于在命令行中格式化输出 json 文件的文章,今天我们再来分享一下如何在命令行中格式化输出 xml。

xml(可扩展标记语言)也是一种人类可读的标记语言,但是如同 json 文件一样,没有缩进格式(或者压缩)的 xml 文件,读起来那是挺头疼的。

首先来看一下我们这篇文章要达到的目的,如下图所示:

图片

要实现这种效果,我们总结了三种方法。作为演示的例子,我们使用如下文件 email.xml:​

<emails> <email> <from>Sagar</from> <to>Milan</to> <time>2022-10-14</time><subject>Writing a lot these days</subject></email> <email><from>Sagar</from> <to>Arvind</to> <time>2022-10-13</time> <subject>Heyy, send me the Goa pictures ASAP!</subject></email> </emails>

方法1:使用 xmllint 格式化打印 xml

xmllint 工具提供了 --format 选项,可以让用户重新格式化 xml 文件。如下语法所示:

xmllint

比如,作为演示,我们使用 email.xml:

xmllint --format email.xml

图片

格式化输出,默认缩进两个空格。如果想要修改为更多的空格(比如4个空格),可以使用环境变量 XMLLINT_INDENT

比如,我们使用 email.xml 作为例子,使其缩进为 4 个空格:

XMLLINT_INDENT="    "

图片

结合前一个例子,大家可以看到区别吗?

方法2:使用 XMLStarlet 工具包

XMLStarlet 提供了一组命令,分别用于不同的目的。其中涉及到了 xml 命令,可以通过该命令来执行与 xml 文件相关的操作。

但是在使用之前,需要手动安装,如下所示:

sudo

要格式化输出 xml,需要使用 xml 命令的 format 选项,如下所示:

xml format email.xml

图片

另外,它还提供了一些其他的选项,如下:

  • -n 不添加空格,结果类似于文本向左对齐;
  • -t 使用 tab 键输出以提高可读性;
  • -o 省略 xml 生命,除了在文件的顶部添加 <?xml versinotallow=”1.0″?>;
  • -s 添加任意数量的空格。

比如,我们使用 fo 添加 6 个空格来格式化输出 xml 文件:

xml fo -s 6 email.xml

图片

方法3:使用 xml_pp 命令

这个方法不是很灵活,因为 xml_pp Perl 的一个模块,名为 XML::Twig

它不会输出内容,但是会直接修改源文件。

它在使用之前,同样需要手动安装。如果你使用的是基于 Debian 的系统,可使用如下命令:

sudo apt install xml-twig-tools

比如,我们使用 record 模式来格式化输出 email.xml:

图片

这里, -i 选项用于在原始文件中进行更改,同时用于附加扩展名。

-s 选项用于使用样式选项,这里我使用了 record