htmlpa2.py

来自「可以获得每天更新的恶意网站公布的恶意站点并下载恶意代码文本和exe文件」· Python 代码 · 共 121 行

121 行

'''
note: this author is netspider_2007 of nxu.
      welcome to my blog: netspider_2007
'''
import re
import urllib
import datetime
import os
def html2table(html):
    trs = re.findall(r'<tr>.*?</tr>', html, re.DOTALL)
    rows = []
    for tr in trs:
        
            x = re.findall(r'<td>(.*?)</td>', tr, re.DOTALL)
            x = map(lambda s: s.strip(), x)
            rows.append(x)
    return rows

def getWebPageContent(url):
    fu = urllib.urlopen(url)
    data = fu.read()
    fu.close()
    return data

d=datetime.date.today()
url = r'http://www.malwaredomainlist.com/mdl.php?search='+d.isoformat().replace("-","/")+'&colsearch=All&quantity=All' #
html = urllib.urlopen(url).read()




name=d.isoformat()#.replace("-","/")


if not os.path.exists(r'd:/URLS/'+name):
    os.makedirs(r'd:/URLS/'+name)
if not os.path.exists(r'd:/URLS/'+name+'/exe/'):
    os.makedirs(r'd:/URLS/'+name+'/exe/')
if not os.path.exists(r'd:/URLS/'+name+'/txt/'):
    os.makedirs(r'd:/URLS/'+name+'/txt/')



    

path=r'd:/URLS/'+name+'/'
try:

    os.remove( path+'url.txt')
    os.remove( path+'MalwareCallHome.txt')

except  WindowsError:

    pass
# if url.txt or malwarecallHome.txt exist ,del them ,then create


rows = html2table(html)
f=file(path+'url.txt','a')
ff=file(path+'MalwareCallHome.txt','a')







rows=rows[3:]



for r in rows: #
    for c in r[1:2]:
        if r[4]!="Malware calls home":
            if r[1]=="-":
                 tt=r[2].replace("<wbr>","")
                 #print tt
                 if tt.find('.txt')==-1 and tt.find('.exe')==-1:
                     f.writelines(tt+'\n')
                 else:
                     #print 'txt&exe'#spide
                     print tt
                     try:
                         content = getWebPageContent(tt)
                         fp=file(path+tt,'a')
                         fp.write(content)
                         fp.close()
                     except:
                        pass
                
            else:
                 tt=r[1].replace("<wbr>","")
                 #print tt
                 if tt.find('.txt')==-1 and tt.find('.exe')==-1:
                     f.writelines(tt+'\n')
                 else:
                     #print 'txt&exe'#spide
                     print tt
                     try:
                         content = getWebPageContent(tt)
                         fp=file(path+tt,'a')
                         fp.write(content)
                         fp.close()
                     except:
                        pass
        else:# not walware calls home
            if r[1]=="-":
                tt=r[2].replace("<wbr>","")
                ff.writelines(tt+'\n')
            else:
                tt=r[1].replace("<wbr>","")
                ff.writelines(tt+'\n')
    
    #print
    #f.writelines('\n')
       
f.close()
ff.close()

htmlpa2.py - 源码说明

本页面展示了「可以获得每天更新的恶意网站公布的恶意站点并下载恶意代码文本和exe文件」中的 htmlpa2.py 源码文件，采用 Python 编程语言编写，共 121 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫开发者社区收录了大量与exe相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?