linux计数相同行命令统计行数 linux

linux shell怎么找出重复行

你可以使用sort命令进行排序，这样就能看到重复行，然后再用uniq去除

创新互联是一家专业提供大石桥企业网站建设,专注与成都网站建设、成都做网站、H5高端网站建设、小程序制作等业务。10年已为大石桥众多企业、政府机构等服务。创新互联专业网络公司优惠进行中。

cat filename | sort | uniq

利用Linux命令行进行文本按行去重并按重复次数排序

利用linux命令行进行文本按行去重并按重复次数排序linux命令行提供了非常强大的文本处理功能，组合利用linux命令能实现好多强大的功能。本文这里举例说明如何利用linux命令行进行文本按行去重并按重复次数排序。主要用到的命令有sort，uniq和cut。其中，sort主要功能是排序，uniq主要功能是实现相邻文本行的去重，cut可以从文本行中提取相应的文本列(简单地说，就是按列操作文本行)。用于演示的测试文件内容如下：[plain]Hello

World.

Apple

and

Nokia.

Hello

World.

wanna

buy

Apple

device.

The

Iphone

Apple

company.

Hello

World.

The

Iphone

Apple

company.

name

Friendfish.

Hello

World.

Apple

and

Nokia.

实现命令及过程如下：[plain]1、文本行去重

(1)排序

由于uniq命令只能对相邻行进行去重复操作，所以在进行去重前，先要对文本行进行排序，使重复行集中到一起。

sort

test.txt

Apple

and

Nokia.

Apple

and

Nokia.

Hello

World.

Hello

World.

Hello

World.

Hello

World.

wanna

buy

Apple

device.

name

Friendfish.

The

Iphone

Apple

company.

The

Iphone

Apple

company.

(2)去掉相邻的重复行

sort

test.txt

uniq

Apple

and

Nokia.

Hello

World.

wanna

buy

Apple

device.

name

Friendfish.

The

Iphone

Apple

company.

2、文本行去重并按重复次数排序

(1)首先，对文本行进行去重并统计重复次数(uniq命令加-c选项可以实现对重复次数进行统计。)。

sort

test.txt

uniq

-c

Apple

and

Nokia.

Hello

World.

wanna

buy

Apple

device.

name

Friendfish.

The

Iphone

Apple

company.

(2)对文本行按重复次数进行排序。

sort

-n可以识别每行开头的数字，并按其大小对文本行进行排序。默认是按升序排列，如果想要按降序要加-r选项(sort

-rn)。

sort

test.txt

uniq

-c

sort

-rn

Hello

World.

The

Iphone

Apple

company.

Apple

and

Nokia.

name

Friendfish.

wanna

buy

Apple

device.

(3)每行前面的删除重复次数。

cut命令可以按列操作文本行。可以看出前面的重复次数占8个字符，因此，可以用命令cut

-c

取出每行第9个及其以后的字符。

sort

test.txt

uniq

-c

sort

-rn

cut

-c

Hello

World.

The

Iphone

Apple

company.

Apple

and

Nokia.

name

Friendfish.

wanna

buy

Apple

device.

下面附带说一下cut命令的使用，用法如下：[plain]cut

-b

list

[-n]

[file

...]

cut

-c

list

[file

...]

cut

-f

list

[-d

delim][-s][file

...]

上面的-b、-c、-f分别表示字节、字符、字段（即byte、character、field）；

list表示-b、-c、-f操作范围，-n常常表示具体数字；

file表示的自然是要操作的文本文件的名称；

delim（英文全写：delimiter）表示分隔符，默认情况下为TAB；

-s表示不包括那些不含分隔符的行（这样有利于去掉注释和标题）

三种方式中，表示从指定的范围中提取字节（-b）、或字符（-c）、或字段（-f）。

范围的表示方法：

只有第n项

从第n项一直到行尾

n-m

从第n项到第m项(包括m)

-m

从一行的开始到第m项(包括m)

从一行的开始到结束的所有项

在写这篇文章的时候，用到了vim的大小写转化的快捷键：gu变小写，gU变大写。结合ctrl+v能够将一片文字中的字符进行大小写转换，非常好用。

我有两个文件，需要用linux 命令提取两个文件中，输出分别有的行和相同的行，求助如何写命令？

你算问对人咯。使用linux的comm

如果是WIN下的文件，注意先转换换行符号！！！

先对文件进行排序去重复:sort filename1 |uniqfilename1-sorted

然后对第2个文件也排序去重复并管道使用comm 找出符合你要求的：

共同拥有的行：sort filename2|uniq|comm -12 - filename1-sorted 共同拥有的

文件 filename1-sorted独有的： sort filename2|uniq|comm -13 - filename1-sortedfilename1-sorted独有

文件 filename2独有的： sort filename2|uniq|comm -23 - filename1-sortedfilename2独有。

赶紧给分，哈哈！

用comm相对比较简单，也可以用 awk做：

共同拥有的：

gakw 'ARGIND==1{a[$1]=$1} ARGIND1{if(a[$1]!="") print $0}' file1 file2共同拥有

gakw 'ARGIND==1{a[$1]=$1} ARGIND1{if(a[$1]＝="") print $0}' file1 file2file2独有

gakw 'ARGIND==1{a[$1]=$1} ARGIND1{if(a[$1]＝="") print $0}' file2 file1file1独有

Linux 文件行数统计

一、行数统计方法

1、系统命令：wc -l filename

2、grep方法：grep -c "" filename

3、sed方法：sed -n '$=' filename

4、awk方法：awk 'END{print NR}' filename

参考文件

分享标题：linux计数相同行命令统计行数 linux
链接URL：http://shouzuofang.com/article/ddidcoo.html

网站建设知识

linux计数相同行命令统计行数 linux

linux shell怎么找出重复行

利用Linux命令行进行文本按行去重并按重复次数排序

我有两个文件，需要用linux 命令提取两个文件中，输出分别有的行和相同的行，求助如何写命令？

Linux 文件行数统计

其他资讯

网站建设知识

linux计数相同行命令 统计行数 linux

linux shell怎么找出重复行

利用Linux命令行进行文本按行去重并按重复次数排序

我有两个文件，需要用linux 命令提取两个文件中，输出 分别有的行 和 相同的行，求助如何写命令？

Linux 文件行数统计

其他资讯

linux计数相同行命令统计行数 linux

我有两个文件，需要用linux 命令提取两个文件中，输出分别有的行和相同的行，求助如何写命令？