読者です 読者をやめる 読者になる 読者になる

blechmusikの日記

キー・カスタマイズ・ソフトウェア "DvorakJ" の覚え書きをはじめとして様々なことを書いています。

OCRで読み取った縦書きの表をエクセルで編集し始めるまでの一連の操作例

目次

  • はじめに
  • 罫線とセルの結合を解除する
  • セル内の不要な改行を取り除く
  • 不要な列(と行)を削除する
  • 初期状態の表を参考にして行を並び替える
  • おわりに

はじめに

書籍や冊子に掲載されている表をOCRで読み取り、それをエクセルで編集しようとする場面を想像してほしい。その表をエクセルで編集しようとしたときに、体裁があまりにも揃っていないならばどうだろうか。編集作業をする気力が削がれてしまう恐れがある。具体的には以下のような体裁が想定される。

これがもしも以下のように整った体裁であったならば、間違いなく編集しやすいだろう。

以下では、前者の画像中の体裁(以下では初期状態の体裁と呼ぶ)を後者の画像中の体裁(以下では改変終了時の体裁と呼ぶ)へと改変していくエクセル*1の一連の操作を、画像を表示しながら説明する。


罫線とセルの結合を解除する

初期状態の体裁を見てすぐに気づくのは、適切ではない罫線が引かれていることと、体裁を変更する上で支障になる恐れがあるセルの結合の二つだろう。画像中の説明に従って、まずはこの二つを解除する。

これらが正しく解除されると、つぎのように表示される。


表の行と列を入れ替える

つぎに表の行と列を入れ替えよう。行と列を入れ替えるには、表の該当箇所を選択してからコピーし、行と列を入れ替える貼り付けを行う。行と列を入れ替える貼り付けの際には、二カ所に表示されるボタンのどちらをクリックしてもよい。

こうして表の行と列を入れ替えたことで、表全体を編集しやすくなったと思う。


セル内の不要な改行を取り除く

表の行と列を入れ替えてすぐに気づくのは、セル内に不要な改行が存在することである。

これらの改行を取り除くには、エクセルの置換機能を用いれば良い。この置換処理では[Ctrl] + [J]というキーバインドを使用することになるのだが、これは[Ctrl]を押しながら[J]を押すという動作を表す。置換対象の文字列を指定する入力欄でこの動作を行うと画面上は何も変わらないのだが、セル内の改行を置換対象とする情報は正しく処理される。

セル内の改行を取り除くと、以下のように表示される。


不要な列(と行)を削除する

ここまでの操作を行うと、データが何も入力されていない列や行が見つかるだろう。それらを適宜取り除いた方がよい。

不要な列と行を取り除くとこうなる。


初期状態の表を参考にして行を並び替える

ここで初期状態の表を一度確認したい。

改変中の表の体裁はつぎのとおりである。

ここで気づくのは、初期状態の表の右側にあるものが、改変中の表では下部に存在するということだ。時間的に先に目につく情報を考えてみると、縦書きでは右側にある情報であり、他方横書きでは上側にある情報だろう。そう考えると、初期状態の表と改変中の表では、本来あるべき箇所に情報が存在しなくなってしまったのである。
これを改めて、初期状態の表の右側にあるものは改変中の表では上部に置くべきだろう。
ではどのように操作すればそのような体裁へと改変できるのだろうか。連番のセルを作成して行を並び替えるのである。改変中の表の左側に1から始まる連番のセルをつぎのように作成する。


この連番中のセルをもとにして、表中の行を降順で並び替える。

こうして、初期状態の体裁を改変終了時の体裁へと改変することができた。


おわりに

以上、OCRで読み取った縦書きの表をエクセルで編集し始めるまでの一連の操作を、画像を示しながら説明した。このエントリーではExcel 2010の環境を想定して説明してきたので、違うバージョンを使用している場合は適宜読み替える必要がある。ただ、今回のエントリーで説明した操作手順は、Excel のバージョンが変わったとしても、大幅に変わることはまずないと思う。
なお、フォントの大きさや種類が統一されていない場合は、表の範囲を選択してから、フォントの大きさや種類を指定し直せばよい。
本エントリーで触れた操作に関しては、以下のページが参考になる。

*1:ここではExcel 2010を想定している。