一个小程序的Python和Bash版本比较

探手摘星辰

2014-09-05

最近有一个小需求：在一个目录下有很多文件，每个文件的第一行是BEGIN开头的，最后一行是END开头的，中间每一行有多列，数量不等，第一列称为"DN", 第二列称为"CV"，DN和CV的联合作为主键，现在需要检测文件中是否有重复的DN-CV。

于是写了个简单的Python程序

#! /usr/bin/python
import os
import sys
cmd = "cat /home/zhangj/hosts/* | grep -v BEGIN | grep -v END"
def check_dc_line():
 has_duplicate = False
 dc_set = set()
 for dc_line in os.popen(cmd, 'r').readlines():
  dc_token = dc_line.split()
  dn = dc_token[0]
  cv = dc_token[1]
  dc = dn + "," + cv
  if dc in dc_set:
   print "duplicate dc found:", dc
   has_duplicate = True
  else:
   dc_set.add(dc)
 return has_duplicate
if not check_dc_line():
    print "no duplicate dc"

对于250个文件，共60万行的数据，过滤一遍约1.67秒

有点不甘心这个效率，于是又写了一个同样功能的shell脚本

#! /bin/bash
cat /home/zhangj/hosts/* | grep -v BEGIN | grep -v END | awk '
 BEGIN {
  has_duplicate = 0
 }
 {
  dc = $1","$2; 
  if (dc in dc_set) 
  {
   print "duplicate dc found", dc 
   has_duplicate = 1
  } 
  else {
   dc_set[dc] = 1
  }
 }
 END {
  if (has_duplicate ==0)
  {
   print "no duplicate dc found"
  }
 }
'

为了进一步比较，重复了10次实验。

	use python (second)	use bash (second)
	1.74	1.548
	1.698	1.423
	1.674	1.408
	1.718	1.286
	1.757	1.292
	1.600	1.285
	1.647	1.335
	1.661	1.316
	1.654	1.288
	1.647	1.288
average	1.670	1.347

可读性上看，python更简洁优雅一些。不过执行效率略有出乎意料。shell貌似更快一些……

Python 的详细介绍：请点这里
Python 的下载地址：请点这里

探手摘星辰

0 关注 0 粉丝 0 动态

相关推荐

浅析Linux之bash反弹shell原理

反弹shell往往是在攻击者无法直接连接受害者的情况下进行的操作，原因有很多，例如目标是局域网，或者开启防火墙的某些策略等情况，而这时，我们就可以让受害者主动向攻击者发起连接，被控端发起请求到控制端某端口，并将其命令行的输入输出转到控制端，从而实现交互。L

applecarelte 2020-10-16

如何友好的把Python和Bash结合在一起

对于Linux用户而言，命令行操作我们已经非常熟悉了。与其他流行的操作系统不同，在Linux社区中，使用命令行与使用图形用户界面执行类似任务相比，命令行通常可以提供更优雅，更有效的解决方案。随着Linux社区对命令行的依赖不断增长，UNIX shell已发

touchfuture 2020-09-16

拥有此神技，脚本调试从此与 echo、set、test 说分手

为什么要为 Bash 脚本写单元测试？因为 Bash 脚本通常都是在执行一些与操作系统有关的操作，可能会对运行环境造成一些不可逆的操作，比如修改或者删除文件、升级系统中的软件包等。所以为了确保 Bash 脚本的安全可靠，在生产环境中部署之前一定需要做好足够

Testingba工作室 2020-09-15

为Bash脚本写单元测试

为什么要为 Bash 脚本写单元测试?因为 Bash 脚本通常都是在执行一些与操作系统有关的操作，可能会对运行环境造成一些不可逆的操作，比如修改或者删除文件、升级系统中的软件包等。所以为了确保 Bash 脚本的安全可靠，在生产环境中部署之前一定需要做好足够

TuxedoLinux 2020-09-11

使用批处理脚本在特定目录中启动Git-Bash窗口

平时想要在项目目录中输入git命令，我需要先打开git-bash窗口，然后还要cd到项目目录中。命令解释start用于启动一个窗口F:\Program" "Files\Git\git-bash.exe是git-bash的路径，注意路径中

guying 2020-08-16

Centos命令行报bash:.....:command not found的解决办法

命令行输入命令执行后报“bash:....:command not found”这是由于系统PATH设置问题，PATH没有设置对，系统就无法找到精确命令了。命令执行完之后先不要关闭终端。我的Linux系统是由于设置JAVA环境变量时设置PATH属性导致co

haitianisgood 2020-07-21

深入了解定制Bash

操作系统的最外层 —— 也就是跟你直接打交道的 —— 叫做shell。Fedora 预装了好几种不同的 shell。在文档中，你常常能见到两个母缩写词 GUI 跟 CLI，它们用来区分图形和基于字符的 shell/界面。GNOME和Bash分别是 Fedo

luobotoutou 2020-07-20

第一次月考

A、useradd B、chown C、chmod D、groupadd. A、无实意 B、#!A、-r-xrwx— B、0640 C、0750 D、-rw-r- - - -. A、0 表示

luvzhan 2020-06-28

Bash 补全详解

在设计基于Bash的中文文件拼音补全的时候，需要高度定制的补全策略，于是特意研究了下Bash的补全机制。${COMP_WORDS} 的索引，指向当前光标位置所在的词。这个变量只有在被命令补全功能调用的 shell 函数和外部命令中才可用。相对于当前命令起始

Jieen 2020-06-28

如何使用Bash history命令

Bash 的 history 命令在它提供的功能数量上超过了所有其他 Linux Shell 历史接口。也就是说，它是一个古老的的 shell，还有一个更古老的 Shell 的前辈，但是它还有一个很棒的history命令，它提供的功能数量超过了所有其他 s

renshuguo 2020-06-24

如何在Bash中编写函数

通过编写函数来减少代码的冗余和维护。在编程时，实际上是在定义要由计算机执行的过程procedure或例程routine。一个简单的类比是将计算机编程与烤面包进行比较：你一次列出了要组建工作环境的配料，然后列出了烤面包所必须采取的步骤。在编程和烘烤中，必须以

cutdeer 2020-06-17

认识与学习bash

loginshell 取得bash时需要完整的登入流程，需要用户输入登入账号与密码:系统整体设置文件/etc/profile与~/.bash_profile. non-login shell 取得bash的接口方法不需要重复登入，以图形界面启动终端机，并不

lishaokang 2020-06-08

第2章 Shell解释器

[ ~]# ll /bin/shlrwxrwxrwx. 1 root root 4 5月 15 19:42 /bin/sh -> bash

伏雌摘星阁 2020-06-07

第3章 Shell脚本入门

　　在/root/目录下创建一个名称为a的目录，在a目录中创建一个名称为b.txt的文件，在b.txt文件中增加“The second shell script”。/bin/bashmkdir /root/acd /root/atouch b.txtech

DBATips 2020-06-07

Linux基础3-1 Bash及其特性

shell是用户连接到计算机使用的外壳程序，在shell中定义的别名仅在当前shell声明周期中有效，且有效范围只在当前shell，如果切换shell进程或更替shell周期，则别名失效

xiaobater 2020-05-26

kali linux bash: command not found

今天新装的kali linux，然后发现好多系统最基础的命令，都报错。有时候新装的系统中没有设置环境变量。明显是环境变量 PATH 出了问题。bin 为 binary 的简写主要放置一些系统的必备执行档例如:cat、 cp、 chmod df、 dmesg

木子李CSDN 2020-05-18

linux(centos8):查看操作系统的当前版本(os/kernel/bash)

centos8上默认未安装这个包，根据提示安装。在上面的提示后输入 y,系统自动安装。也可手动执行dnf命令安装。LSB是linux的标准化项目,目标是增强linux各个发行版的兼容性，它开发了一系列标准，使各种软件可以很好地在兼容 LSB 标准的系统上运

死鱼喜欢猫 2020-05-15

git bash相关命令

git commit进入vim模式的命令。强制保存，但是不退出vim

yhuihon 2020-05-15

[Linux Shell学习系列三]常用Shell（Bash）命令-其他常用命令

hostname命令用于查看系统的主机名，或是修改系统的主机名。# hostname -F /root/hostname.txt #使用-F参数，从文件中读取新的主机名。w命令用于显示登录的用户及他们当前运行的进程。who命令与w命令相似，但功能更强大。d

hongsheyoumo 2020-05-14

shell脚本-编程前奏-bash特性

tab只能补全命令和文件。^c　　终止前台运行的程序。^d　　　　退出等价于exit. ^l　　　　　清屏。^a home 　光标移动到命令行的最前端。^k　　　　删除光标后所有字符。^r　　　　搜索历史命令。{string1，stri

gcong 2020-05-14

探手摘星辰

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号