重複したIDや名称を見つけるのに、uniqが使えます。
takk@deb8:~$ sort -R /usr/share/dict/words | head -20 | cat -n > c
このようにして作ったファイルcを編集してフィールドの各要素を重複させます。
こんなデータになりました。
1 anchorperson's
2 blacks
3 phosphoric
4 Levine's
5 migration's
6 Dramamine's
7 minibusses
8 fetal
9 salesperson
10 postpones
11 unmanageable
12 Linda
13 Felicia
13 Pamela
14 rotogravure
15 Donetsk's
16 Steinway
17 Pamela
17 minibusses
18 forum's
19 linesman's
20 butler's
ではuniqを使って重複列を探します。
まずは1列目のIDについて、重複IDと重複の回数を表示。
takk@deb8:~$ cut -f1 c | sort | uniq -cd
2 13
2 17
takk@deb8:~$
左が重複回数、右がIDです。
次に、2列目。1列目を無視するオプション-fを指定して、チェックすると、IDも一緒に表示されて見つけやすいです。
takk@deb8:~$ sort -k2 c | uniq -cdf1
2 13 Pamela
2 7 minibusses
takk@deb8:~$



コメント