集計を出力するときに都道府県名をスペース節約のため漢字一文字でコンパクトに表したい。よくある話だとは思うが、自分で使う用のデータなので車輪の再発明とかはどうでもよくて、納得いく形で選択したい。
以下、決め方と一覧表。
基本方針:
最初の一文字に重複のあるもの:
重複時の決定方針:
都道府県名一文字表記一覧表:
TSVファイルを下記に置いておきます:
なお、Perlでプログラムを書いて自動でやらせてもみたのですが、岡山が山になったりでイマイチでした。結局最後は人の感覚かな。ソースコードをこちらに置いておきますので興味のある方はどうぞ。
後から調べてみると、当然ですが、同じようなことはすでに考えられています。
以下、決め方と一覧表。
方針
基本方針:
- 基本的に最初の一文字を用いる。
- 重複がある場合は二文字目を使う(山と大)。
- それでも問題がありそうなものはいろいろ考えて決定(福など)。
最初の一文字に重複のあるもの:
| 福 | 福島, 福井, 福岡 |
| 山 | 山形, 山梨, 山口 |
| 長 | 長野, 長崎 |
| 愛 | 愛知, 愛媛 |
| 宮 | 宮城, 宮崎 |
| 大 | 大阪, 大分 |
重複時の決定方針:
- 山:山は使わずに山形は形、山梨は梨、山口は口
- 大:大は使わずに大阪は阪、大分は分
- 長:長崎は崎(宮崎)が既出なので長、長野は野
- 愛:愛知は知(高知)が既出なので愛、愛媛は媛
- 宮:宮崎は崎(長崎)が既出なので宮、宮城は城
- 福:福井は井、福島は島、福岡が福
- 福井は井がユニークなので井で決定
- 福島を福にすると福岡が岡になるが、唯一岡で始まる岡山が山となり、山形・山梨・山口の3県と紛らわしい
- 福岡を福にすると福島が島になり、唯一島で始まる島根とかぶるが、島根の根はユニーク
- 島根を根にすることで解決
成果物
都道府県名一文字表記一覧表:
| ID | 一文字 | 都道府県名 | 重複考慮 |
|---|---|---|---|
| 1 | 北 | 北海道 | |
| 2 | 青 | 青森 | |
| 3 | 岩 | 岩手 | |
| 4 | 城 | 宮城 | ※ |
| 5 | 秋 | 秋田 | |
| 6 | 形 | 山形 | ※ |
| 7 | 島 | 福島 | ※ |
| 8 | 茨 | 茨城 | |
| 9 | 栃 | 栃木 | |
| 10 | 群 | 群馬 | |
| 11 | 埼 | 埼玉 | |
| 12 | 千 | 千葉 | |
| 13 | 東 | 東京 | |
| 14 | 神 | 神奈川 | |
| 15 | 新 | 新潟 | |
| 16 | 富 | 富山 | |
| 17 | 石 | 石川 | |
| 18 | 井 | 福井 | ※ |
| 19 | 梨 | 山梨 | ※ |
| 20 | 野 | 長野 | ※ |
| 21 | 岐 | 岐阜 | |
| 22 | 静 | 静岡 | |
| 23 | 愛 | 愛知 | ※ |
| 24 | 三 | 三重 | |
| 25 | 滋 | 滋賀 | |
| 26 | 京 | 京都 | |
| 27 | 阪 | 大阪 | ※ |
| 28 | 兵 | 兵庫 | |
| 29 | 奈 | 奈良 | |
| 30 | 和 | 和歌山 | |
| 31 | 鳥 | 鳥取 | |
| 32 | 根 | 島根 | ※ |
| 33 | 岡 | 岡山 | |
| 34 | 広 | 広島 | |
| 35 | 口 | 山口 | ※ |
| 36 | 徳 | 徳島 | |
| 37 | 香 | 香川 | |
| 38 | 媛 | 愛媛 | ※ |
| 39 | 高 | 高知 | |
| 40 | 福 | 福岡 | ※ |
| 41 | 佐 | 佐賀 | |
| 42 | 長 | 長崎 | |
| 43 | 熊 | 熊本 | |
| 44 | 分 | 大分 | ※ |
| 45 | 宮 | 宮崎 | ※ |
| 46 | 鹿 | 鹿児島 | |
| 47 | 沖 | 沖縄 |
TSVファイルを下記に置いておきます:
なお、Perlでプログラムを書いて自動でやらせてもみたのですが、岡山が山になったりでイマイチでした。結局最後は人の感覚かな。ソースコードをこちらに置いておきますので興味のある方はどうぞ。
参考
後から調べてみると、当然ですが、同じようなことはすでに考えられています。
- [都道府県を漢字1文字で表すと?] by 何カト見聞録
http://vicroad.blog31.fc2.com/blog-entry-405.html- 競輪の出走表での都道府県名表記。
- 見た感じ、だいたい私の方針に近いです。
