arrow_upward
343
arrow_downward

Используйте псевдоколонку rowid.

DELETE FROM your_table
WHERE rowid not in
(SELECT MIN(rowid)
FROM your_table
GROUP BY column1, column2, column3);

Где column1, column2 и column3 составляют идентификационный ключ для каждой записи. Вы можете перечислить все свои столбцы.

Bill the Lizard 09.02.2009

comment

+1 Мне пришлось найти два повторяющихся телефонных номера, закопанных в более чем 12 000 записей. Изменил DELETE на SELECT, и это нашло их за секунды. Сэкономил мне массу времени, спасибо. - shimonyk; 23.09.2010

comment

Этот подход у меня не сработал. Не знаю почему. Когда я заменил DELETE на SELECT *, он вернул строки, которые я хотел удалить, но когда я выполнил с помощью DELETE, он просто зависал на неопределенное время. - aro_biz; 25.06.2012

comment

Моя тоже либо висит, либо просто работает очень долго. Бегала около 22 часов и все еще еду. В таблице 21M записей. - Cameron Castillo; 22.08.2013

comment

Я предлагаю добавить дополнительную фильтрацию к оператору WHERE, если у вас очень большой набор данных и, если возможно, это может помочь людям с длительными запросами. - Ricardo Sanchez; 08.04.2014

comment

Если выбор работает, а удаление нет, это может быть связано с размером результирующего подзапроса. Может быть интересно сначала создать таблицу с результатом подзапроса, построить индекс по столбцу min (rowid), а затем запустить оператор удаления. - Wouter; 15.05.2014

comment

Разве это не удалит только первый дубликат, если их несколько? - Darrel Lee; 11.01.2018

arrow_upward
17
arrow_downward

Из Спросите Тома

delete from t
 where rowid IN ( select rid
                    from (select rowid rid, 
                                 row_number() over (partition by 
                         companyid, agentid, class , status, terminationdate
                                   order by rowid) rn
                            from t)
                   where rn <> 1);

(исправлены недостающие круглые скобки)

Dead Programmer 18.03.2011

comment

В заявлении отсутствуют круглые скобки. Полагаю, это должно быть в конце? - Cameron Castillo; 22.08.2013

arrow_upward
15
arrow_downward

С DevX.com:

DELETE FROM our_table
WHERE rowid not in
(SELECT MIN(rowid)
FROM our_table
GROUP BY column1, column2, column3...) ;

Где column1, column2 и т. Д. - это ключ, который вы хотите использовать.

Mark 09.02.2009

arrow_upward
8
arrow_downward

Решение 1)

delete from emp
where rowid not in
(select max(rowid) from emp group by empno);

Решение 2)

delete from emp where rowid in
               (
                 select rid from
                  (
                    select rowid rid,
                      row_number() over(partition by empno order by empno) rn
                      from emp
                  )
                where rn > 1
               );

Решение 3)

delete from emp e1
         where rowid not in
          (select max(rowid) from emp e2
           where e1.empno = e2.empno );

DoOrDie 31.12.2015

comment

Не могли бы вы рассказать нам о плюсах и минусах каждого подхода? - Arun Gowda; 26.08.2020

arrow_upward
7
arrow_downward

создать таблицу t2 как выбрать отличную * от t1;

Mohammed khaled 11.01.2013

comment

не ответ - distinct * будет брать каждую запись, которая отличается хотя бы 1 символом в 1 столбце. Все, что вам нужно, это выбрать отдельные значения только из столбцов, которые вы хотите сделать первичными ключами - ответ Билла - отличный пример такого подхода. - Nogard; 11.01.2013

comment

Это было то, что мне было нужно (удалить полностью идентичные строки). Спасибо ! - Emmanuel; 20.02.2013

comment

Еще одним недостатком этого метода является то, что вам нужно создать копию своей таблицы. Для огромных таблиц это подразумевает предоставление дополнительного табличного пространства, а также удаление или сжатие табличного пространства после копирования. У метода Билла больше преимуществ, но нет дополнительных недостатков. - Wouter; 15.05.2014

arrow_upward
3
arrow_downward

Вы должны создать небольшой блок pl / sql с помощью курсора для цикла и удалить строки, которые вы не хотите сохранять. Например:

declare
prev_var my_table.var1%TYPE;

begin

for t in (select var1 from my_table order by var 1) LOOP

-- if previous var equal current var, delete the row, else keep on going.
end loop;

end;

Nick 09.02.2009

comment

Я считаю, что отрицательное голосование вызвано тем, что вы используете PL / SQL, когда можете делать это в SQL, если вам интересно. - WW.; 10.02.2009

comment

То, что вы можете сделать это в SQL, не означает, что это единственное решение. Я опубликовал это решение после того, как увидел решение только для SQL. Я думал, что голоса были за неправильные ответы. - Nick; 10.02.2009

arrow_upward
3
arrow_downward

Для выбора дубликатов можно использовать только формат запроса:

SELECT GroupFunction(column1), GroupFunction(column2),..., 
COUNT(column1), column1, column2...
FROM our_table
GROUP BY column1, column2, column3...
HAVING COUNT(column1) > 1

Итак, правильный запрос в соответствии с другим предложением:

DELETE FROM tablename a
      WHERE a.ROWID > ANY (SELECT b.ROWID
                             FROM tablename b
                            WHERE a.fieldname = b.fieldname
                              AND a.fieldname2 = b.fieldname2
                              AND ....so on.. to identify the duplicate rows....)

Этот запрос сохранит самую старую запись в базе данных для критериев, выбранных в WHERE CLAUSE.

Сертифицированный партнер Oracle (2008 г.)

user1799846 17.06.2014

arrow_upward
2
arrow_downward

Самый быстрый способ для действительно больших столов

Создайте таблицу исключений со структурой ниже: exceptions_table
```
ROW_ID ROWID
OWNER VARCHAR2(30)
TABLE_NAME VARCHAR2(30)
CONSTRAINT VARCHAR2(30)
```
Попробуйте создать уникальное ограничение или первичный ключ, который будет нарушен дубликатами. Вы получите сообщение об ошибке, потому что у вас есть дубликаты. Таблица исключений будет содержать идентификаторы повторяющихся строк.
```
alter table add constraint
unique --or primary key
(dupfield1,dupfield2) exceptions into exceptions_table;
```
Присоединяйтесь к своей таблице с помощью exceptions_table по rowid и удаляйте дубли
```
delete original_dups where rowid in (select ROW_ID from exceptions_table);
```
Если количество удаляемых строк велико, создайте новую таблицу (со всеми грантами и индексами), предотвращающую объединение с exceptions_table по rowid, переименуйте исходную таблицу в таблицу original_dups и переименуйте new_table_with_no_dups в исходную таблицу
```
create table new_table_with_no_dups AS (
    select field1, field2 ........ 
    from original_dups t1
    where not exists ( select null from exceptions_table T2 where t1.rowid = t2.row_id )
)
```

user2158672 30.05.2014

arrow_upward
2
arrow_downward

Используя rowid-

delete from emp
 where rowid not in
 (select max(rowid) from emp group by empno);

Использование самостоятельного соединения

delete from emp e1
 where rowid not in
 (select max(rowid) from emp e2
 where e1.empno = e2.empno );

Dnyaneshwar Tandale 28.12.2015

comment

Привет, Тандейл, пожалуйста, используйте инструмент форматирования кода при отправке ответов, так как он повышает удобочитаемость. - NSNoob; 28.12.2015

arrow_upward
2
arrow_downward

Решение 4)

 delete from emp where rowid in
            (
             select rid from
                (
                  select rowid rid,
                  dense_rank() over(partition by empno order by rowid
                ) rn
             from emp
            )
 where rn > 1
);

DoOrDie 31.12.2015

comment

Вы можете немного объяснить? - Dieter Meemken; 31.12.2015

comment

Плотный ранг с разделением по дает ранг для повторяющихся строк с одинаковым номером, например, три строки с рангом 1, 1, 1 и rowid создают для каждой строки как unic, и мы пытаемся удалить те rowid, которые не совпадают. - DoOrDie; 31.12.2015

comment

мы можем использовать как функции rank, так и elastic_rank, но я думаю, что rank отлично работает в этом сценарии. - DoOrDie; 31.12.2015

arrow_upward
2
arrow_downward

1. решение

delete from emp
    where rowid not in
    (select max(rowid) from emp group by empno);

2. Sloution

delete from emp where rowid in
               (
                 select rid from
                  (
                    select rowid rid,
                      row_number() over(partition by empno order by empno) rn
                      from emp
                  )
                where rn > 1
               );

3-е решение

delete from emp e1
         where rowid not in
          (select max(rowid) from emp e2
           where e1.empno = e2.empno );

4. решение

 delete from emp where rowid in
            (
             select rid from
                (
                  select rowid rid,
                  dense_rank() over(partition by empno order by rowid
                ) rn
             from emp
            )
 where rn > 1
);

Community 10.02.2016

arrow_upward
2
arrow_downward

5. решение

delete from emp where rowid in 
    (
      select  rid from
       (
         select rowid rid,rank() over (partition by emp_id order by rowid)rn from emp     
       )
     where rn > 1
    );

DoOrDie 10.02.2016

arrow_upward
2
arrow_downward

DELETE from table_name where rowid not in (select min(rowid) FROM table_name group by column_name);

и вы также можете удалить повторяющиеся записи другим способом

DELETE from table_name a where rowid > (select min(rowid) FROM table_name b where a.column=b.column);

Md Wasi 07.01.2017

arrow_upward
1
arrow_downward

Вот что я написал для лучшей производительности:
(см. План выполнения)

DELETE FROM your_table
WHERE rowid IN 
  (select t1.rowid from your_table  t1
      LEFT OUTER JOIN (
      SELECT MIN(rowid) as rowid, column1,column2, column3
      FROM your_table 
      GROUP BY column1, column2, column3
  )  co1 ON (t1.rowid = co1.rowid)
  WHERE co1.rowid IS NULL
);

Enguerrand JORE 11.03.2015

arrow_upward
1
arrow_downward

Проверьте ниже скрипты -

1.

Create table test(id int,sal int);

2.

    insert into test values(1,100);    
    insert into test values(1,100);    
    insert into test values(2,200);    
    insert into test values(2,200);    
    insert into test values(3,300);    
    insert into test values(3,300);    
    commit;

3.

 select * from test;

Здесь вы увидите 6 записей.
4. запустите ниже запрос -

delete from 
   test
where rowid in
 (select rowid from 
   (select 
     rowid,
     row_number()
    over 
     (partition by id order by sal) dup
    from test)
  where dup > 1)

select * from test;

Вы увидите, что повторяющиеся записи были удалены.
Надеюсь, это решит ваш запрос. Спасибо :)

Rakesh Roshan 14.09.2017

arrow_upward
1
arrow_downward

Я не видел ответов, в которых используются общие табличные выражения и оконные функции. Это то, с чем мне легче всего работать.

DELETE FROM
 YourTable
WHERE
 ROWID IN
    (WITH Duplicates
          AS (SELECT
               ROWID RID, 
               ROW_NUMBER() 
               OVER(
               PARTITION BY First_Name, Last_Name, Birth_Date)
                  AS RN
               SUM(1)
               OVER(
               PARTITION BY First_Name, Last_Name, Birth_Date
               ORDER BY ROWID ROWS BETWEEN UNBOUNDED PRECEDING 
                                       AND UNBOUNDED FOLLOWING)
                   AS CNT
              FROM
               YourTable
              WHERE
               Load_Date IS NULL)
     SELECT
      RID
     FROM
      duplicates
     WHERE
      RN > 1);

На заметку:

1) Мы проверяем только дублирование полей в разделе раздела.

2) Если у вас есть причина выбрать один дубликат поверх других, вы можете использовать предложение order by, чтобы эта строка имела row_number () = 1

3) Вы можете изменить сохраняемый дубликат номера, изменив последнее предложение where на «Where RN> N» с N> = 1 (я думал, что N = 0 удалит все строки с дубликатами, но просто удалит все строки) .

4) Добавлено поле Sum partition для запроса CTE, которое помечает каждую строку числом строк в группе. Поэтому для выбора строк с дубликатами, включая первый элемент, используйте «WHERE cnt> 1».

Darrel Lee 01.11.2017

arrow_upward
1
arrow_downward

Это сообщение в блоге было действительно полезно для общих случаев:

Если строки полностью дублированы (все значения во всех столбцах могут иметь копии), столбцов для использования нет! Но чтобы сохранить его, вам все равно понадобится уникальный идентификатор для каждой строки в каждой группе. К счастью, в Oracle уже есть кое-что, что вы можете использовать. Гребец. У всех строк в Oracle есть rowid. Это физический локатор. То есть он указывает, где на диске Oracle хранит строку. Это уникально для каждой строки. Таким образом, вы можете использовать это значение для идентификации и удаления копий. Для этого замените min () на min (rowid) в некоррелированном удалении:

delete films
where  rowid not in (
  select min(rowid)
  from   films
  group  by title, uk_release_date
)

Ala Abid 07.06.2021

arrow_upward
0
arrow_downward

решение :

delete from emp where rowid in
(
    select rid from
    (
        select rowid rid,
        row_number() over(partition by empno order by empno) rn
        from emp
    )
    where rn > 1
);

sandeep gupta 28.06.2019

arrow_upward

arrow_downward

comment

Повторите мой комментарий выше к ответу, получившему наибольшее количество голосов, именно этот запрос фактически решил мою проблему. - aro_biz; 25.06.2012

comment

На огромных столах это будет намного медленнее, чем решение Билла. - Wouter; 15.05.2014

arrow_upward

arrow_downward

comment

Тот же ответ, что и более подробный ответ Ящера Билла. - Wouter; 15.05.2014

arrow_upward

arrow_downward

comment

Вы можете добавить больше информации о своем пути? Спасибо. - Reporter; 20.05.2014

arrow_upward

arrow_downward

comment

Главный недостаток этого метода - внутреннее соединение. Для больших таблиц это будет намного медленнее, чем метод Билла. Кроме того, использование PL / SQL для этого является излишним, вы также можете использовать это, просто используя sql. - Wouter; 15.05.2014

Удаление повторяющихся строк из таблицы в Oracle

Ответы (22)

Решение 1)

Решение 2)

Решение 3)

Решение 4)

Удаление повторяющихся строк из таблицы в Oracle

Ответы (22)

Решение 1)

Решение 2)

Решение 3)

Решение 4)

Вопросы по теме