忘れないようにメモっとく

機械学習とかプログラミングとか。

awkで列の種類ごとに集計する。

連想配列のキーにグループの名前を使えばおk。

集計するファイル↓↓

hoge.txt

りんご 230
りんご 300
ばなな 190
ばなな 190
みかん 110
りんご 310
ばなな 190
みかん 110
みかん 130

awkファイル↓↓

sum.awk

{
    sum[$1]+=$2
};
END {
    for (key in sum) {
        print key, sum[key]
    }
}

スクリプトの実行と結果。

awk -f sum.awk hoge.txt

ばなな 570
みかん 350
りんご 840