ホームページ >データベース >Oracle >Oracle データベースから重複データを削除するための一般的な方法を要約して整理します。

Oracle データベースから重複データを削除するための一般的な方法を要約して整理します。

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB転載: 2022-08-22 17:59:303489ブラウズ

この記事では、Oracle に関する関連知識を提供し、主にデータクリーニング中に削除されることが多いテーブル内の重複データについて紹介します。一緒に見てみましょう。皆さんのお役に立てれば幸いです。

推奨チュートリアル: 「Oracle ビデオチュートリアル」

テストデータの作成

create table nayi224_180824(col_1 varchar2(10), col_2 varchar2(10), col_3 varchar2(10));
insert into nayi224_180824
select 1, 2, 3 from dual union all
select 1, 2, 3 from dual union all
select 5, 2, 3 from dual union all
select 10, 20, 30 from dual ;
commit;
select*from nayi224_180824;

COL_1	COL_2	COL_3
1	2	3
1	2	3
5	2	3
10	20	30

指定された列、重複排除後の結果セットを確認してください

distinct

select distinct t1.* from nayi224_180824 t1;

##COL_1COL_2COL_3 #1015すべてのクエリ列のみを重複排除できるため、この方法は非常に制限されています。 Col_2 と Col3 を重複排除したい場合、結果セットには、col_2 列と Col_3 列のみを含めることができますが、col_1 は含めることができません。


20	30
2	3
2	3

select distinct t1.col_2, col_3 from nayi224_180824 t1

COL_2#220しかし、これは最もシンプルで理解しやすい方法でもあります。

COL_3
3
30

row_number()

select *
  from (select t1.*,
               row_number() over(partition by t1.col_2, t1.col_3 order by 1) rn
          from nayi224_180824 t1) t1
 where t1.rn = 1
;

COL_1#123110 20301##書くのはかなり面倒ですが、柔軟性が高くなります。指定された列について、すべての重複行を検索します。

COL_2	COL_3	RN

count が

select *
  from nayi224_180824 t
 where (t.col_2, t.col_3) in (select t1.col_2, t1.col_3
                                from nayi224_180824 t1
                               group by t1.col_2, t1.col_3
                              having count(1) > 1)

COL_1COL_21222テーブルを 2 回確認する必要がある場合、効率は比較的低くなります。お勧めしません。カウントオーバー

COL_3
3		1
3		5
3

select *
  from (select t1.*,
               count(1) over(partition by t1.col_2, t1.col_3) rn
          from nayi224_180824 t1) t1
 where t1.rn > 1
;

#COL_1

COL_2COL_3RN12331233523#テーブルを確認する必要があるのは 1 回だけです。推奨されます。重複する行をすべて削除

delete from nayi224_180824 t
 where t.rowid in (
                   select rid
                     from (select t1.rowid rid,
                                   count(1) over(partition by t1.col_2, t1.col_3) rn
                              from nayi224_180824 t1) t1
                    where t1.rn > 1);

上記のステートメントは少し変更されています。




#3

重複データを削除し、1 つを保持

分析関数メソッド

delete from nayi224_180824 t
 where t.rowid in (select rid
                     from (select t1.rowid rid,
                                  row_number() over(partition by t1.col_2, t1.col_3 order by 1) rn
                             from nayi224_180824 t1) t1
                    where t1.rn > 1);

は一貫して高い柔軟性を備えた分析関数を備えています。グループ化を自由に実行したり、orderby 句を変更して「最大 ID を保持する」などの要件を達成したりできます。

group by

delete from nayi224_180824 t
 where t.rowid not in
       (select max(rowid) from nayi224_180824 t1 group by t1.col_2, t1.col_3);

効率を高める代わりに柔軟性を犠牲にします。

推奨チュートリアル: 「

Oracle ビデオチュートリアル

」

以上がOracle データベースから重複データを削除するための一般的な方法を要約して整理します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

声明：

この記事はjb51.netで複製されています。侵害がある場合は、admin@php.cn までご連絡ください。

前の記事：Oracle ロックテーブルソリューションの詳細なグラフィックとテキストの説明次の記事：Oracle ロックテーブルソリューションの詳細なグラフィックとテキストの説明

続きを見る

Oracle データベースから重複データを削除するための一般的な方法を要約して整理します。

テスト データの作成

指定された列、重複排除後の結果セットを確認してください

distinct

#COL_1

分析関数メソッド

group by

効率を高める代わりに柔軟性を犠牲にします。

」

関連記事

テストデータの作成