昨日のシェル芸ヴェンキョウカイ(問2)で話題になった、commコマンドについて。
自分はたまたま先週使ったことがあって知ってたんですが、シェル芸ヴェンキョウカイで初めて知った!っていう人もいたみたいだし、せっかくなので使い方をまとめておきます。

テストデータ

問2;https://github.com/ryuichiueda/ShellGeiData/tree/master/vol.18/Q2

内容

commコマンドとは

#### 名称
comm − 2つのファイルの共通な行もしくは共通でない行を出力する



#### 書式
comm [−123i] file1 file2



#### 解説
comm ユーティリティは、 file1 と file2 を読み込んで(辞書的にソートされて いる必要があります)、 3 つのテキストカラムを出力します: それぞれ、 file1 のみにある行; file2 のみにある行; 両方のファイルにある行です。

オプションなしで試してみましょう。

  • file1
1
2
3
4
5
6
% sort a
分倍河原
川崎
谷保
鹿島田

  • file2
1
2
3
4
5
6
% sort b
分倍河原
南多摩
登戸
谷保

ソートしてcommに食わせます。

1
2
3
4
5
6
7
8
% comm <(sort a) <(sort b)
                分倍河原
        南多摩
川崎
        登戸
                谷保
鹿島田

3列の出力が得られます。空の部分には、1列につき1つのtab(\t)が詰まっています。各列の意味は

  • 1列目 … file1 のみにある行
  • 2列目 … file2 のみにある行
  • 3列目 … 両方にある行
となっています。

オプション

  • -1オプション … 1列目を表示しない (2列目と3列目を表示)
  • -2オプション … 2列目を表示しない (1列目と3列目を表示)
  • -3オプション … 3列目を表示しない (1列目と2列目を表示)
組み合わせも可能で、
  • -12オプション … 1列目と2列目を表示しない (3列目だけ表示)
  • -13オプション … 1列目と3列目を表示しない (2列目だけ表示)
  • -23オプション … 2列目と3列目を表示しない (1列目だけ表示)
  • -123オプション … 1列目と2列目と3列目を表示しない (何も出さない)
となります。

オプションの実行例

  • 2列目を表示しない (1列目と3列目を表示)
1
2
3
4
5
6
% comm -2 <(sort a) <(sort b)
        分倍河原
川崎
        谷保
鹿島田

  • 1列目と2列目を表示しない (3列目だけ表示)
1
2
3
4
% comm -12 <(sort a) <(sort b)
分倍河原
谷保

スキップされた列・行は詰められるみたいです。
以上!

参考URL