excel 重複 削除

デザイン五輪書

Excelにおける必殺仕事人!?重複の削除機能を120%活用する!

読了までの目安時間:約 8分

 

にほんブログ村 イラストブログ Photoshopへコンピュータグラフィックス ブログランキングへFC2ブログランキングブログランキングならblogram i2iブログランキング

Excelにおける必殺仕事人!?重複の削除機能を120%活用する!

Excelの重複の削除機能

重複の削除機能の役割

Excelの便利機能の一つに、「重複の削除」と言う機能があります。
この機能、本当にありがたいもので、データベース内で重複しているデータを自動的に検索し、重複している項目が合った場合は、そのレコード(行)ごと削除してくれます。

データの重複

削除されるレコードは、後の方のレコードです。

データの重複で削除されるレコード

私の場合、検索キーワード選定法でご紹介した方法で、「キーワードプランナー」から抽出した検索キーワードをExcelファイル内にストックしています。
Excelファイルのデーターベース内にストックしているキーワード数は四万に届きそうなほどありますが、「キーワードプランナー」からデータを追加すると、一度で数十から数百単位のキーワードが重複してしまいます。

重複データが削除された

四万近くのレコードの中からキーワードの重複する行を探すとなると、はっきり言って不可能です。
ですから、この「重複の削除」と言う機能はとても重宝出来るのです。
「重複の削除」を使用すれば、四万近くのデータベースでも、一瞬で重複データを削除してくれます。

▲もくじへ戻る

重複の削除機能を使用する

では、実際に「重複の削除」機能を使用してみましょう。

まずは、データベース内の任意のセルを選択しておきます。
データベース内であれば、どのセルでも大丈夫です。

データベース内のセルを選択

続いて、「リボン」の「データ」タブをクリックします。

データタブ

「データツール」グループ内にある「重複の削除」をクリックします。

重複の削除

「重複の削除」ダイアログが表示されます。
データベースに見出しを設定している場合は、「先頭行をデータの見出しとして使用する」にチェックを入れます。
逆に、データベースに見出しを設定していない場合は、「先頭行をデータの見出しとして使用する」のチェックを外します。

先頭行をデータの見出しとして使用する

そして、「OK」をクリックし、「重複の削除」ダイアログを閉じます。
すると、データベース内の重複するレコードが削除された事を知らせるダイアログが表示されます。

重複データが削除された

「OK」をクリックして、ダイアログを閉じます。
データベース内の重複するレコードが削除されました。

重複データが削除されたデータベース

▲もくじへ戻る

重複条件を部分一致に

レコードの完全一致では効率が悪い!?

上記方法は、レコード内が完全一致した場合にのみ重複データと見なされ、レコードが削除されます。
ですから、レコード内の項目が一つでも異なる場合は、削除対象にはなりません。

レコードが完全一致した場合のみ削除対象に

つまり、レコード内のどこか一ヶ所でも入力ミスがあった時点で別のデータとして扱われ、結果的に、データベース内にレコードが残ってしまうと言う事になります。

また、データベースの管理上も効率が悪いです。
例えば、作例の顧客管理のデータベースに、日々、新しいデータを追加して行くとしましょう。

レコードが完全一致しなければ重複データとして削除されませんので、「氏名」、「年齢」、「住所」、「購入品目」と、レコード内を全て記述する必要があります。
それが、後には重複データとして削除される可能性があるにも関わらず、全項目記述しなければならない訳です。

・・・つまり、作業に無駄が生じてしまう訳です。

▲もくじへ戻る

部分一致の条件で重複の削除を行う

そこで、Excelの「重複の削除」機能には、部分一致のみでもレコードを重複データとして見なすように設定する事が出来ます。
部分一致のみで重複データの判別が出来るのであれば、新たにデータベースに追加するデータは、取り敢えず一項目のみを記述して行き、その項目で重複するかどうかを判別すれば良いと言う事になります。

一項目のみを埋める

重複データの削除後、残ったレコードのデータを追加して行けば、作業に無駄がありません。

では実際に、部分一致のみで重複データを削除してみましょう。
まずは、データベース内の任意のセルを選択しておきます。

データベース内のセルを選択

続いて、「リボン」の「データ」タブをクリックします。

データタブ

「データツール」グループ内にある「重複の削除」をクリックします。

重複の削除

「重複の削除」ダイアログが表示されます。
データベースに見出しを設定している場合は、「先頭行をデータの見出しとして使用する」にチェックを入れます。
逆に、データベースに見出しを設定していない場合は、「先頭行をデータの見出しとして使用する」のチェックを外します。

先頭行をデータの見出しとして使用する

続けて、「すべて選択解除」をクリックし、全ての列に入れられているチェックを外します。

すべて選択解除

今度は、「列」の中から、重複データを判別する基準としたい列にチェックを入れます。
作例では、「氏名」にチェックを入れました。

重複データを判別する列を選択

「OK」をクリックして「重複の削除」ダイアログを閉じると、重複データのあるレコードが削除された事を知らせるダイアログが表示されます。

重複データの削除を知らせるダイアログ

「OK」をクリックし、ダイアログを閉じます。
「氏名」列に重複データがあるレコードが削除されました。

重複データが削除されたデータベース

▲もくじへ戻る

重複の削除機能を使用時の注意点

重複データとしての判定

「重複の削除」機能を使用した際、重複データとして判定されなければ、レコードは削除されません。
例えば、「相田定信」と「相田 定信」とでは、半角スペースがある分、別のデータとして見なされます。
同様に、「相田定信」と「相田定信 」も、後ろに半角スペースがあるので、重複データとは判定されません。

他にも、色々実験をしてみました。
ひらがなとカタカナの場合、別のデータとして見なされます。
また、半角英数字と全角英数字も、別のデータとして判定されました。

意外だったのが、大文字と小文字です。
こちらは、大文字だろうが小文字だろうが関係無く、重複データとして判定されました。

データベースにデータを記入する際は、この点を意識して記入したいところです。

▲もくじへ戻る

並び替えとの併用

データベースに「並び替え」の設定を行っていた場合、「重複の削除」機能を使用すると、自動的に「並び替え」機能も適用されます。
とても便利ではあるのですが、データベースを並び替えられると困ると言う方は、「重複の削除」機能を使用する前に、「並び替え」の設定を解除しておく必要があります。

ちなみに、「並び替え」機能の設定方法に関しては、「Excelの並び替えってどうやるの?超効率的、並び替え設定法」をご覧下さい。

▲もくじへ戻る

まとめ

レコードの重複は珍しい事では無い

今回は、Excelの重複の削除機能についてご紹介しました。

    おさらい
  • 重複の削除機能の働き。
  • 重複条件の完全一致と部分一致。
  • 重複データの判定基準。
  • 並び替え機能との併用。

データベースを管理する上で、レコードの重複は珍しい事ではありません。
それに加え、レコードの数が増えるに連れ、目視での重複データの判定は不可能になって来ます。
ですから、今回ご紹介した内容をしっかりと覚えておいて、定期的に、データベースの重複データの削除を行う必要があります。

今回ご紹介した内容を、ぜひ、業務にも役立てて下さい。
最後までご覧頂き、ありがとうございました。

にほんブログ村 イラストブログ Photoshopへコンピュータグラフィックス ブログランキングへFC2ブログランキングブログランキングならblogram i2iブログランキング

タグ :

ソフトウェア Microsoft Office   コメント:0

この記事に関連する記事一覧

TOPへ戻る