集計を出力するときに都道府県名をスペース節約のため漢字一文字でコンパクトに表したい。よくある話だとは思うが、自分で使う用のデータなので車輪の再発明とかはどうでもよくて、納得いく形で選択したい。
以下、決め方と一覧表。
基本方針:
最初の一文字に重複のあるもの:
重複時の決定方針:
都道府県名一文字表記一覧表:
TSVファイルを下記に置いておきます:
なお、Perlでプログラムを書いて自動でやらせてもみたのですが、岡山が山になったりでイマイチでした。結局最後は人の感覚かな。ソースコードをこちらに置いておきますので興味のある方はどうぞ。
後から調べてみると、当然ですが、同じようなことはすでに考えられています。
以下、決め方と一覧表。
方針
基本方針:
- 基本的に最初の一文字を用いる。
- 重複がある場合は二文字目を使う(山と大)。
- それでも問題がありそうなものはいろいろ考えて決定(福など)。
最初の一文字に重複のあるもの:
福 | 福島, 福井, 福岡 |
山 | 山形, 山梨, 山口 |
長 | 長野, 長崎 |
愛 | 愛知, 愛媛 |
宮 | 宮城, 宮崎 |
大 | 大阪, 大分 |
重複時の決定方針:
- 山:山は使わずに山形は形、山梨は梨、山口は口
- 大:大は使わずに大阪は阪、大分は分
- 長:長崎は崎(宮崎)が既出なので長、長野は野
- 愛:愛知は知(高知)が既出なので愛、愛媛は媛
- 宮:宮崎は崎(長崎)が既出なので宮、宮城は城
- 福:福井は井、福島は島、福岡が福
- 福井は井がユニークなので井で決定
- 福島を福にすると福岡が岡になるが、唯一岡で始まる岡山が山となり、山形・山梨・山口の3県と紛らわしい
- 福岡を福にすると福島が島になり、唯一島で始まる島根とかぶるが、島根の根はユニーク
- 島根を根にすることで解決
成果物
都道府県名一文字表記一覧表:
ID | 一文字 | 都道府県名 | 重複考慮 |
---|---|---|---|
1 | 北 | 北海道 | |
2 | 青 | 青森 | |
3 | 岩 | 岩手 | |
4 | 城 | 宮城 | ※ |
5 | 秋 | 秋田 | |
6 | 形 | 山形 | ※ |
7 | 島 | 福島 | ※ |
8 | 茨 | 茨城 | |
9 | 栃 | 栃木 | |
10 | 群 | 群馬 | |
11 | 埼 | 埼玉 | |
12 | 千 | 千葉 | |
13 | 東 | 東京 | |
14 | 神 | 神奈川 | |
15 | 新 | 新潟 | |
16 | 富 | 富山 | |
17 | 石 | 石川 | |
18 | 井 | 福井 | ※ |
19 | 梨 | 山梨 | ※ |
20 | 野 | 長野 | ※ |
21 | 岐 | 岐阜 | |
22 | 静 | 静岡 | |
23 | 愛 | 愛知 | ※ |
24 | 三 | 三重 | |
25 | 滋 | 滋賀 | |
26 | 京 | 京都 | |
27 | 阪 | 大阪 | ※ |
28 | 兵 | 兵庫 | |
29 | 奈 | 奈良 | |
30 | 和 | 和歌山 | |
31 | 鳥 | 鳥取 | |
32 | 根 | 島根 | ※ |
33 | 岡 | 岡山 | |
34 | 広 | 広島 | |
35 | 口 | 山口 | ※ |
36 | 徳 | 徳島 | |
37 | 香 | 香川 | |
38 | 媛 | 愛媛 | ※ |
39 | 高 | 高知 | |
40 | 福 | 福岡 | ※ |
41 | 佐 | 佐賀 | |
42 | 長 | 長崎 | |
43 | 熊 | 熊本 | |
44 | 分 | 大分 | ※ |
45 | 宮 | 宮崎 | ※ |
46 | 鹿 | 鹿児島 | |
47 | 沖 | 沖縄 |
TSVファイルを下記に置いておきます:
なお、Perlでプログラムを書いて自動でやらせてもみたのですが、岡山が山になったりでイマイチでした。結局最後は人の感覚かな。ソースコードをこちらに置いておきますので興味のある方はどうぞ。
参考
後から調べてみると、当然ですが、同じようなことはすでに考えられています。
- [都道府県を漢字1文字で表すと?] by 何カト見聞録
http://vicroad.blog31.fc2.com/blog-entry-405.html- 競輪の出走表での都道府県名表記。
- 見た感じ、だいたい私の方針に近いです。