古い記事
ランダムジャンプ
新しい記事
集計を出力するときに都道府県名をスペース節約のため漢字一文字でコンパクトに表したい。よくある話だとは思うが、自分で使う用のデータなので車輪の再発明とかはどうでもよくて、納得いく形で選択したい。

以下、決め方と一覧表。

方針


基本方針:
  • 基本的に最初の一文字を用いる。
  • 重複がある場合は二文字目を使う(山と大)。
  • それでも問題がありそうなものはいろいろ考えて決定(福など)。

最初の一文字に重複のあるもの:
福島, 福井, 福岡
山形, 山梨, 山口
長野, 長崎
愛知, 愛媛
宮城, 宮崎
大阪, 大分

重複時の決定方針:
  • 山:山は使わずに山形は形、山梨は梨、山口は口
  • 大:大は使わずに大阪は阪、大分は分
  • 長:長崎は崎(宮崎)が既出なので長、長野は野
  • 愛:愛知は知(高知)が既出なので愛、愛媛は媛
  • 宮:宮崎は崎(長崎)が既出なので宮、宮城は城
  • 福:福井は井、福島は島、福岡が福
    • 福井は井がユニークなので井で決定
    • 福島を福にすると福岡が岡になるが、唯一岡で始まる岡山が山となり、山形・山梨・山口の3県と紛らわしい
    • 福岡を福にすると福島が島になり、唯一島で始まる島根とかぶるが、島根の根はユニーク
      • 島根を根にすることで解決

成果物


都道府県名一文字表記一覧表:
ID一文字都道府県名重複考慮
1北海道
2青森
3岩手
4宮城
5秋田
6山形
7福島
8茨城
9栃木
10群馬
11埼玉
12千葉
13東京
14神奈川
15新潟
16富山
17石川
18福井
19山梨
20長野
21岐阜
22静岡
23愛知
24三重
25滋賀
26京都
27大阪
28兵庫
29奈良
30和歌山
31鳥取
32島根
33岡山
34広島
35山口
36徳島
37香川
38愛媛
39高知
40福岡
41佐賀
42長崎
43熊本
44大分
45宮崎
46鹿鹿児島
47沖縄

TSVファイルを下記に置いておきます:

なお、Perlでプログラムを書いて自動でやらせてもみたのですが、岡山が山になったりでイマイチでした。結局最後は人の感覚かな。ソースコードをこちらに置いておきますので興味のある方はどうぞ。

参考


後から調べてみると、当然ですが、同じようなことはすでに考えられています。