利用Python进行SEPM virus definition自动下载:(一)环境准备及页面分析
1、背景说明:
? 专线环境中有一套“Symantec Enpoint Protection Manager”(简称SEPM)软件,由于不能访问因特网,所以杀毒软件定义包文件等,需要每日手动下载后,拷贝到SEPM所在的服务器上。
?借助于Python写一个程序,每天定时的去下载这些定义包,等到上班后直接进行拷贝。
2、 环境准备:
?本程序需要借助于Python程序和一些软件包。
2.1 Python软件及IDE安装
?Python及IDE的安装网上有很多,可以自行搜索,
2.2 Python库安装:
?本程序需要另外安装以下两个库:
名称 | PyPI链接 | 说明 |
---|---|---|
requests | requests主页 | URL访问,文件下载 |
tqdm | tqdm主页 | 模拟下载进度条显示 |
?安装过程:
①、查看已安装 Package:
# pip list
②、安装 Package:
# pip install PackageName
2.3 IDE环境配置
Pycharm设置
?打开PyCharm的环境设置(Configure>Settings),然后选择“Project Interpreter”,再右侧的“Project Interpreter”中选择我们的Python环境,如果你只有一个默认环境,这个直接设置即可。
?选择了环境后,下方会加载出,此环境中已经安装的软件包
Visual Studio Code设置
?需要先新建一个工作空间,然后通过快捷键“Ctrl + Shift + P”打开“命令选项板”,在其中输入“python:select interpreter”,然后启动“Python:选择解释器”,在已识别到的环境中,选择我们需要的环境即可。
?设置好解释器后,会在工作区目录下生成一个settings.json文件,里面保存着Python环境相关信息。
?新建一个Python文件,命名为“SEPDefineDown.py”,在右面的编辑区就可以编辑代码了。
3 编程前的网页分析
?Symantec被博通收购过后,网页显示的布局没有多大的变化。
定义包的下载链接为:
SEPM12:https://www.broadcom.com/support/security-center/definitions/download/detail?gid=sep
SEPM14:https://www.broadcom.com/support/security-center/definitions/download/detail?gid=sep14
3.1 页面显示布局分析
?我们以SEPM14的页面为例进行分析,以获取Windows 64-Bit平台的定义包信息。
?首先,页面布局为:
?根据需求,找出我们需要的内容为:
?我们需要获取到SEPM14定义包有关的信息,包括:文件名称、文件下载URL、文件的大小、文件的MD5值。
3.2 借助开发者工具分析
?我们在网页中右击,点击“查看页面源代码”:
?网页的源代码内容很少,没有我们需要的信息。
?打开浏览器的开发者模式(F12),然后按“F5”进行页面内容的刷新,。
?依次通过“网络>XHR”监测页面的XHR请求。这里发现页面加载了4个JSON文件,其中第四个JSON文件中包含我们需要的文件URL等信息。
3.3 JSON文件分析
JSON文件URL1:https://www.broadcom.com/pubdate/pubdate.json
JSON文件URL2:https://www.broadcom.com/api/navigation?locale=avg_en
JSON文件URL3:https://www.broadcom.com/api/v2/getmetadata?vanityurl=support/security-center/definitions/download/detail&locale=avg_en&lastpubdate=2020-04-28-11:15:29
JSON文件URL4:https://www.broadcom.com/api/getjsonbyurl?vanityurl=support/security-center/definitions/download/detail&locale=avg_en&updateddate=2020-04-28-10:22:44&gid=sep14
?我们需要的内容在第四个JSON文件中,但是第四个JSON文件的URL中包含“updateddate”参数。
?“locale”字段位于第二个JSON文件中,但是这个不是变化的,所以我们可以不用管。
?“vanityurl”字段位于第三个JSON文件中,但是这个不是变化的,我们也可以不管。为了程序的健壮性,编程的时候,可以把这两个参数的值也用程序处理JSON内容获取
?我们对其他三个JSON文件的URL及文件的内容进行分析,可以发现“JSON文件URL4”中的“updateddate”字段内容位于“JSON文件3”的内容中,“JSON文件URL3”中的“lastpubdate”字段内容位于“JSON文件1”的内容中。
?我们对第1、3、4个JSON的文件内容先进行分析。
第1个JSON文件包含“lastpubdate”内容,结构如下:
{ "content_id":"12345678910", "content_type":"Page", "lastpubdate":"2020-04-28-11:15:29", "lastnavdate":"2020-04-28-06:10:51" }
第3个JSON文件的结构:
{ ……, "updateddate":"2020-04-28-10:22:44", …… }
?第4个JSON文件的结构:
{ "groups": { "packages": {……} …… { "id":"jdb_core3sds_package", …… "file": {"name":"jdb/core3sds/vd593617core3sds.jdb", "_url_":"https://definitions.symantec.com/defs/jdb/core3sds/vd593617core3sds.jdb", "ftp_url_":"http://definitions.symantec.com/defs/jdb/core3sds/vd593617core3sds.jdb", "created_date":"4/28/2020", "release_date":"4/28/2020", "size":"54.21 MB", "md5":"6654672CC5BAC2AD0ED9E383FFFC0F81", "md5_url_":"security-response/glossary", "md5_all_url":"https://www.broadcom.com/avcenter/download/md5-hash.txt" } } }
?后面可以通过编程对JSON文件进行处理(Python有个内置的JSON文件处理库),得到我们需要的URL等信息,之后再进行下载等操作。
利用Python进行SEPM virus definition自动下载:(二)代码实现
https://blog.51cto.com/3chou/2491348