网络管理:网络设备的批量化操作


在大通等地区,都构建了全面的区域性战略布局,加强发展的系统性、市场前瞻性、产品创新能力,以专注、极致的服务理念,为客户提供成都做网站、网站设计 网站设计制作定制网站设计,公司网站建设,企业网站建设,品牌网站设计,网络营销推广,外贸网站建设,大通网站建设费用合理。

新浪微博:@wandering

博客地址:  dayong.info


在深入进行网络工作一段时间后,开始着手解决AAA、NTP、SYSLOG基础服务(简称:基础服务)的可用性和线上设备相关配置的正确性问题。

前期,一边优化、重构基础服务,一边修正线上配置。但这个项目是个系统工程,无法在短期内完成,因此即要保持战果让已修正的配置不再出错,还希望新增加的设备可以直接进行正确配置。另外,如何保证其他工程师也正确配置设备,也是需要解决的问题,毕竟工作最终是需要多个团队共同协作的。

因此,自动检查线上所有重要交换机和路由器的网管服务、Spanning-Tree、VTP Mode等重要配置是否正确,成了必须优先解决的问题。


最直接的方法就是直接检查相应配置,这符合网络管理人员的思维和操作习惯。因此,决定优先解决多台设备的批量执行命令需求。

本人一直对程序设计有这样的观点,不能解决问题的程序不是好程序,因此程序首先要实现功能,其次才是程序的效能。只有在规模、需求达到相当程度后才有必要对效率、性能追求极致。对非专业开发人员来说更是要注意精力、时间的分配,20%的投入获得80%的回报其投入产出比是相当可观的,再多花80%的精力去提升最多20%的性能是必须慎重对待的。因此,决定采用模拟人机交互方式实现网络设备的批量化操作。

程序实现基本逻辑是:

 1)自动登录交换机、路由器批量执行命令,将结果输出。

 2)对输出结果进行二次处理,实现不同目标。


这样,基本可以解决大部分网络管理需要,其主要优点是简单,会操作交换机/路由器的人就可以使用。但是,此方法最大的问题是效率,因为本质上只是由程序模仿手工操作,需要考虑cli可以接受的操作频率等问题。曾考虑过SNMP、TCL-Script、NET-CONF等方法,但考虑到自己的能力及精力分配、跨厂商平台兼容性问题最终放弃。



网上可以查到的模拟人工命令交互操作的方法有2个:perl、expect


首先考虑的是perl,因为有perl编程基础,有其他同事写好的相似功能脚本,但最终放弃。因为perl的switch模块不支持Cisco的Nexus平台内容输出,其解决方法非常复杂,要修改switch模块的源代码,这样会产生自己的分支,管理维护成本太高,不利于程序的持续开发和推广 。


最后,选择expect,其原理是执行命令,根据不同输出反馈采取不同操作,重复这个过程。

关于expect的学习使用,不在本文的关注范围。


以下最新版本的代码:

#!/usr/local/bin/expect
#
# Statement:      sw-telnet.exp    
#
#             ip for telnet
#     For example, sw-backup is cmd-prefix of sw-backup.cmd.h4c and
#                 sw-backup.cmd.cisco
#            uid for telnet
#            pwd for telnet
#
#
# Depends:        .cmd.h4c
#                 .cmd.cisco
#
# 
# Last modified:  2012/05/24
#
# 


set path_cmd "/aaa/bin"
set cmd_telnet "telnet"
set timeout_default 10
set timeout $timeout_default
set vendor "cisco"

# Arg 1
set ip [lindex $argv 0]
if { $ip == "" } {
   puts ""
   puts "Statement: command    "
   puts "                    ^^"
   puts "            ip for telnet"
   puts "    For example, sw-backup is cmd-prefix of sw-backup.cmd.h4c and"
   puts "                sw-backup.cmd.cisco"
   puts "           uid for telnet"
   puts "           pwd for telnet"
   puts ""
   exit 1
}

# Arg 2
set cmd_prefix [lindex $argv 1]
if { $cmd_prefix == "" } {
   puts ""
   puts "Statement: command    "
   puts "                         ^^^^^^^^^^"
   puts "            ip for telnet"
   puts "    For example, sw-backup is cmd-prefix of sw-backup.cmd.h4c and"
   puts "                sw-backup.cmd.cisco"
   puts "           uid for telnet"
   puts "           pwd for telnet"
   puts ""
   exit 1
}

# Arg 3
set uid [lindex $argv 2]
if { $uid == "" } {
   #set uid "backup"
   puts ""
   puts "Statement: command    "
   puts "                                      ^^^"
   puts "            ip for telnet"
   puts "    For example, sw-backup is cmd-prefix of sw-backup.cmd.h4c and"
   puts "                sw-backup.cmd.cisco"
   puts "           uid for telnet"
   puts "           pwd for telnet"
   puts ""
   exit 1
}
 
# Arg 4
set pwd [lindex $argv 3]
if { $pwd == "" } {
   #set pwd "M2dpSF6rSU"
   puts ""
   puts "Statement: command    "
   puts "                                            ^^^"
   puts "            ip for telnet"
   puts "    For example, sw-backup is cmd-prefix of sw-backup.cmd.h4c and"
   puts "                sw-backup.cmd.cisco"
   puts "           uid for telnet"
   puts "           pwd for telnet"
   puts ""
   exit 1
}




#___ start telnet ___

spawn $cmd_telnet "$ip"
sleep 1
expect "H3C" { set vendor "h4c" }
expect -re "Username:|Login:|login:" {
   send "$uid\r"
   sleep 1
}

expect "Password:" {
   send "$pwd\r"
   sleep 1
}


#_____ login failed _____
expect {
   "Access denied" { exit }
   "Connection refused" { exit }
   "Login failed" { exit }
   "Login incorrect" { exit }
   "Login invalid" { exit }
   "Password incorrect." { exit }
   "timeout expired!" { exit }
}



#_____ Command sets selection by vendor (cisco, h4c) _____

switch -- $vendor cisco { # vendor: cisco

   set timeout_cisco 60
   set timeout $timeout_cisco

   #___ get commands __
   set file [ open "$path_cmd/$cmd_prefix.cmd.$vendor" "r" ]
   set cmd_count 0
   while 1 {
      if { [gets $file line] == -1 } break
      incr cmd_count
      set cmd_list($cmd_count) $line
   }
   close $file

   expect -re ".*# *$"
   send "term len 0\r\n\n\n"

   set i 1
   while { $i <= $cmd_count } {
      expect -re ".*# *$"
      send "$cmd_list($i)\r\n\n\n"
      incr i
      sleep 1
   }
   
   expect -re ".*# *$"
   send "exit\r"

} h4c { # vendor: h4c

   set timeout_h4c 10
   set timeout $timeout_h4c

   #___ get commands __
   set file [ open "$path_cmd/$cmd_prefix.cmd.$vendor" "r" ]
   set cmd_count 0
   while 1 {
      if { [gets $file line] == -1 } break
      incr cmd_count
      set cmd_list($cmd_count) $line
   }
   close $file

   set i 1
   while { $i <= $cmd_count } {
      expect -re "<.*>$"
      send "$cmd_list($i)\r\r\r\r"

      expect -re "\- More \-+$" {
         set timeout 3
         set more "yes"
         while {$more == "yes"} {
            #puts "___ more ___\r"
            send " "
            expect -re "<.*>$" {
               #puts "___ there's no more ___"
               set more "no"
            }
         }
         set timeout $timeout_h4c
      }

      incr i
      sleep 1
   }
    
   expect -re "<.*>$"
   send "quit\r"
   
} default { # vendor: unkown

   puts "\nError: Unkown Vendor!\n"
   exit

}



expect eof
puts "\nVendor: $vendor"
puts "Command list:"
set i 1
while { $i <= $cmd_count } {
   puts "$i) $cmd_list($i)"
   incr i
}
puts ""
exit

*注:脚本目前只支持Cisco和H3C两个主流平台。

*注:注意设置程序运行路径变量 path_cmd 。


举例,假设需要对设备1.2.3.4做以下操作:

   1)备份running-config

   2)查看cpu状态



首先,需要建立4个文件,脚本会自动判断Cisco或H3C设备类型执行相应命令集:


   1)backup.cmd.cisco

dir show ver show inv show run

   2)backup.cmd.h4c

dir disp verion disp device manuinfo disp curr

   3)version.cmd.cisco

show process cpu sort | exclude 0.00% show process cpu history

   4)version.cmd.h4c

display cpu-usage



其次,写crontab:

0    3 * * *  /aaa/bin/sw-telnet.exp 1.2.3.4 backup  test_uid test_pwd  >  /bak/1.2.3.4_show-run_$(date +"%Y%m%d") 
*/10 * * * *  /aaa/bin/sw-telnet.exp 1.2.3.4 version test_uid test_pwd  >> /bak/1.2.3.4_show-ver_$(date +"%Y%m%d")



OK,这样就实现了对1.2.3.4的自动抓取running-config和记录cpu状态。




在此代码基础上,完成了以下工作:

  • 对全网重要设备抓取running-config,并实现关键配置检查报警

  • 对某产品相关服务器接入交换机端口进行流量监控、报警(公司监控不能查看port-channel属性)

  • 对某IDC核心交换机的mac地址表监控,增减幅度超过5%报警



自动批量执行命令脚本是核心代码,可以通过其它程序调用实现更复杂的功能,例如对多个IP批量操作,具体实现本文不再赘述。


希望本文能够对有需要的朋友有所帮助,程序代码可以任意使用。





文章名称:网络管理:网络设备的批量化操作
本文路径:http://azwzsj.com/article/jgdoec.html