カテゴリ: Python 更新日: 2026/04/24

Pythonでセット同士の演算(和集合・差集合・積集合)を行う方法 初心者向け完全ガイド

Pythonでセット同士の演算(和集合・差集合・積集合)を行う方法
Pythonでセット同士の演算(和集合・差集合・積集合)を行う方法

先生と生徒の会話形式で理解しよう

生徒

「Pythonのセットって重複を消せるのは知ってるんですが、セット同士を組み合わせたり、共通部分だけを取り出す方法はありますか?」

先生

「はい、それがまさにセット演算です。和集合・差集合・積集合という操作を使えば、データを簡単に整理したり比較できます。」

生徒

「和集合とか積集合って数学で聞いたことがあるような…」

先生

「そうです。中学校や高校の数学で習った集合の概念が、そのままPythonでも使えます。では、具体的な使い方を見ていきましょう。」

1. Pythonのセット演算とは?集合(set)の基本とメリット

1. Pythonのセット演算とは?集合(set)の基本とメリット
1. Pythonのセット演算とは?集合(set)の基本とメリット

Python(パイソン)の「セット(set)」は、数学で学ぶ「集合」と同じ考え方でデータを扱う仕組みです。最大の特徴は、リスト(list)とは違い、「同じ値を重複して持てない」ことと「順番を保持しない」ことです。

このセット同士を組み合わせる「セット演算」をマスターすると、大量のデータの中から特定の条件に合うものだけを瞬時に取り出すことができるようになります。プログラミング未経験の方でも、まずは「グループ同士の比較」とイメージすればOKです。

ここが便利!

例えば、ECサイトの「お気に入りリスト」を比較して、AさんとBさんの好みがどれくらい共通しているか(積集合)、あるいはAさんだけが気になっている商品はどれか(差集合)といった分析が、わずか1行のコードで実現できます。

まずは、セットがどのように重複を排除し、どのようなイメージで演算を行うのか、簡単な例で見てみましょう。


# 買い物リスト(重複あり)をセットに変換する例
fruits_list = ["りんご", "みかん", "りんご", "ぶどう"]
fruits_set = set(fruits_list)

# 自動で重複が消え、ユニークなデータだけが残ります
print(fruits_set)

このように、セットを使えば「データのダブり」を気にする必要がありません。この「きれいなデータの塊」同士を合体させたり、引き算したりするのが、これから解説する「和集合」「差集合」「積集合」といった便利な演算機能です。

2. 和集合(union)|2つのセットを統合する方法

2. 和集合(union)|2つのセットを統合する方法
2. 和集合(union)|2つのセットを統合する方法

和集合(union)とは、2つのセットに含まれるすべての要素を1つにまとめ、新しいセットを作る操作です。セットの最大の特徴である「重複を許さない」という性質により、両方のセットに共通して含まれている要素があっても、結果として出力されるのは1つだけになります。

Pythonで和集合を求めるには、記号の|(垂直棒:パイプライン)を使う方法と、union()メソッドを使う方法の2種類があります。どちらを使っても結果は同じですが、初心者の方は直感的に分かりやすい|から覚えるのがおすすめです。

和集合の具体的な使い方とサンプルコード

例えば、あなたが持っている果物のリストと、友達が持っている果物のリストを合体させて「全種類のメニュー」を作る場面をイメージしてみましょう。


# あなたが持っている果物
my_fruits = {"りんご", "みかん", "バナナ"}
# 友達が持っている果物(バナナが重複しています)
friend_fruits = {"バナナ", "もも", "パイナップル"}

# 方法1:記号「|」を使って和集合を作る
all_fruits_1 = my_fruits | friend_fruits
print(all_fruits_1)

# 方法2:union()メソッドを使って和集合を作る
all_fruits_2 = my_fruits.union(friend_fruits)
print(all_fruits_2)

実行結果は以下の通りです。両方に含まれていた「バナナ」が1つにまとめられ、すべての果物が揃った集合ができあがります。


{'パイナップル', 'もも', 'みかん', 'バナナ', 'りんご'}
{'パイナップル', 'もも', 'みかん', 'バナナ', 'りんご'}

※セットには「順序」がないため、実行するたびに表示される順番が変わることがありますが、中身のデータとしては正しく統合されているので安心してくださいね。

3. 差集合(difference):特定のグループから重複を除外する

3. 差集合(difference):特定のグループから重複を除外する
3. 差集合(difference):特定のグループから重複を除外する

Pythonのセット(set)における「差集合」とは、ある集合から別の集合に含まれる要素を差し引いた、残りの要素を取り出す操作です。簡単に言うと、「Aにはあるけれど、Bにはないもの」だけを抽出するイメージです。

例えば、「買い物リストA」から「すでにカゴに入れたリストB」を差し引いて、まだ買っていないものだけを確認したい時に非常に便利です。実務でも「特定の条件に当てはまらないデータ」を抽出する際によく使われます。

差集合の書き方:マイナス記号(-)かメソッドを使う

差集合を求めるには、算数のように-(マイナス記号)を使う方法と、difference()メソッドを使う方法の2種類があります。初心者のうちは、直感的で分かりやすい-記号を使うのがおすすめです。


# Aさんの好きなフルーツ
a_likes = {"りんご", "みかん", "バナナ"}
# Bさんの好きなフルーツ
b_likes = {"バナナ", "もも", "パイナップル"}

# Aさんだけが好きなもの(AからBと重なる部分を引く)
only_a = a_likes - b_likes
print(f"Aさんだけが好きなフルーツ: {only_a}")

# Bさんだけが好きなもの(BからAと重なる部分を引く)
only_b = b_likes.difference(a_likes)
print(f"Bさんだけが好きなフルーツ: {only_b}")

Aさんだけが好きなフルーツ: {'みかん', 'りんご'}
Bさんだけが好きなフルーツ: {'パイナップル', 'もも'}

ここがポイント!

差集合で注意したいのは、「どちらの集合から引くか」によって結果が変わるという点です。a - bは「aにしかないもの」を返し、b - aは「bにしかないもの」を返します。数学の引き算と同じように、順番を意識して使い分けましょう。

4. 積集合(intersection)

4. 積集合(intersection)
4. 積集合(intersection)

積集合とは、両方のセットに共通して含まれる要素だけを取り出す演算です。記号は&(アンパサンド)またはintersection()メソッドを使います。


a = {"りんご", "みかん", "バナナ"}
b = {"バナナ", "もも", "パイナップル"}
print(a & b)
print(a.intersection(b))

{'バナナ'}
{'バナナ'}

5. 対称差集合(symmetric_difference)

5. 対称差集合(symmetric_difference)
5. 対称差集合(symmetric_difference)

対称差集合とは、どちらか片方にだけ含まれる要素を取り出す演算です。両方にある要素は除かれます。記号は^(キャレット)またはsymmetric_difference()を使います。


a = {"りんご", "みかん", "バナナ"}
b = {"バナナ", "もも", "パイナップル"}
print(a ^ b)

{'もも', 'りんご', 'パイナップル', 'みかん'}

6. 応用例:会員データの比較

6. 応用例:会員データの比較
6. 応用例:会員データの比較

例えば、オンラインサービスの会員データで「無料会員と有料会員の両方にいるユーザー」「無料会員だけのユーザー」「有料会員だけのユーザー」を調べる場合に集合演算が役立ちます。


free_users = {"佐藤", "鈴木", "高橋", "田中"}
paid_users = {"田中", "伊藤", "佐藤"}

# 共通ユーザー
print(free_users & paid_users)
# 無料会員だけ
print(free_users - paid_users)
# 有料会員だけ
print(paid_users - free_users)

{'佐藤', '田中'}
{'高橋', '鈴木'}
{'伊藤'}

7. 初心者が覚えるべきポイント

7. 初心者が覚えるべきポイント
7. 初心者が覚えるべきポイント
  • 和集合:すべての要素をまとめる(| または union()
  • 差集合:片方だけにある要素を取り出す(- または difference()
  • 積集合:両方に共通する要素だけ(& または intersection()
  • 対称差集合:どちらか一方だけにある要素(^ または symmetric_difference()

これらを使いこなすと、データの比較や整理が非常に簡単になります。特に大規模なデータ処理や検索機能の実装にも役立ちます。

コメント
コメント投稿は、ログインしてください

まだ口コミはありません。

関連記事:
カテゴリの一覧へ
新着記事
New1
PHP
PHPでセッションを使ってフォーム入力を保持する方法を解説!初心者向けステップバイステップ
New2
PHP
PHP の文字列の基本操作(連結・切り出し・長さ)の使い方
New3
PHP
PHPのメール送信でSPF・DKIM認証設定を完全解説!初心者でもわかるメール認証の基本
New4
Python
PythonでAPIのパフォーマンスを向上させる方法!キャッシュ活用を初心者向けに完全解説
人気記事
No.1
Java&Spring記事人気No1
Python
Pythonで文字列が数値か判定する方法!isdigit()・isnumeric()の違い
No.2
Java&Spring記事人気No2
PHP
PHP のフォームデータの受け取り($_POST, $_GET)を完全解説!初心者向けガイド
No.3
Java&Spring記事人気No3
Python
Pythonで辞書のネスト構造(入れ子辞書)を扱う方法 初心者向け完全ガイド
No.4
Java&Spring記事人気No4
Python
Pythonのコンストラクタ(__init__)の使い方!初心者でもわかるオブジェクトの初期化
No.5
Java&Spring記事人気No5
PHP
PHPのHTMLメールの作成方法を完全ガイド!初心者でもわかるメール送信の基本
No.6
Java&Spring記事人気No6
Python
PythonでExcelファイル(.xlsx)を操作する方法を徹底解説!初心者でもできるopenpyxl・pandasの使い方
No.7
Java&Spring記事人気No7
Python
Pythonで2次元リストを作成・操作する方法(リストのリスト)
No.8
Java&Spring記事人気No8
Python
Pythonの例外を発生させる方法を完全解説!raise文の使い方を初心者向けにやさしく説明