test_htmllib.py

来自「mallet是自然语言处理、机器学习领域的一个开源项目。」· Python 代码 · 共 43 行

PY
43
字号
import formatterimport htmllibimport unittestimport test_supportclass AnchorCollector(htmllib.HTMLParser):    def __init__(self, *args, **kw):        self.__anchors = []        htmllib.HTMLParser.__init__(self, *args, **kw)    def get_anchor_info(self):        return self.__anchors    def anchor_bgn(self, *args):        self.__anchors.append(args)class HTMLParserTestCase(unittest.TestCase):    def test_anchor_collection(self):        # See SF bug #467059.        parser = AnchorCollector(formatter.NullFormatter(), verbose=1)        parser.feed(            """<a href='http://foo.org/' name='splat'> </a>            <a href='http://www.python.org/'> </a>            <a name='frob'> </a>            """)        parser.close()        self.assertEquals(parser.get_anchor_info(),                          [('http://foo.org/', 'splat', ''),                           ('http://www.python.org/', '', ''),                           ('', 'frob', ''),                           ])def test_main():    test_support.run_unittest(HTMLParserTestCase)if __name__ == "__main__":    test_main()

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?