Comando uniq no Linux: Remover Linhas Duplicadas de Arquivos Ordenados

📅 01/01/2019 ⏱ 1 min ✍️ Uira Ribeiro

Linuxcomandos

Comando uniq no Linux: Remover Linhas Duplicadas de Arquivos Ordenados

Exam Pass App — mais de 7.000 questões LPI, offline, em 5 idiomas, disponível no Android e na App Store

O comando uniq no Linux remove as linhas duplicadas de um arquivo ordenado. Por isso ele é muito usado em conjunto com o comando sort.

As opções mais comuns são:

-c: Indica no início das linhas o número de ocorrências;
-d: Imprime somente as linhas duplicadas;
-i: Ignora a diferença entre maiúsculas e minúsculas;
-u: Imprime somente as linhas únicas, que não têm duplicatas.

Sem ordenação, o uniq não consegue eliminar as duplicatas. Veja o exemplo abaixo:

$ uniq supermercado arrozfeijãocarnebatataalfacetomatearrozcarne

$ sort supermercado | uniqalfacearrozbatatacarnefeijãotomate

O comando uniq é muito útil para retirar duplicatas de arquivos com fonte de dados, especialmente arquivos texto, CSV, etc.

A opção "-i" faz com que o uniq ignore se os itens estão em maiúsculo ou minúsculo.

A opção "-D" mostra somente as linhas duplicadas:

$ sort supermercado | uniq -D arrozarrozcarnecarne

Aprenda muito mais sobre Linux em nosso curso online. Você pode efetuar a matrícula aqui. Se você já tem uma conta, ou quer criar uma, basta entrar ou criar seu usuário aqui.

Gostou? Compartilhe

Prof. Uirá Ribeiro

Chair do Board do Linux Professional Institute

Especialista Linux com mais de 20 anos de experiência.
Autor de 5 livros e mentor de mais de 14.000 alunos certificados.
20 certificações de alto nível, incluindo LPIC-3, CKA, RHCE e AWS Solutions Architect.

Certificação Linux — a plataforma líder em certificações Linux no Brasil