📄 dialect.py

📁 dive int python document
💻 PY
字号:
"""Dialectizer for PythonThis program is part of "Dive Into Python", a free Python book forexperienced programmers.  Visit http://diveintopython.org/ for thelatest version."""__author__ = "Mark Pilgrim (mark@diveintopython.org)"__version__ = "$Revision: 1.2 $"__date__ = "$Date: 2004/05/05 21:57:19 $"__copyright__ = "Copyright (c) 2001 Mark Pilgrim"__license__ = "Python"import refrom BaseHTMLProcessor import BaseHTMLProcessorclass Dialectizer(BaseHTMLProcessor):	subs = ()		def reset(self):		# extend (called from __init__ in ancestor)		# Reset all data attributes		self.verbatim = 0		BaseHTMLProcessor.reset(self)			def start_pre(self, attrs):		# called for every <pre> tag in HTML source		# Increment verbatim mode count, then handle tag like normal		self.verbatim += 1		self.unknown_starttag("pre", attrs)	def end_pre(self):		# called for every </pre> tag in HTML source		# Decrement verbatim mode count		self.unknown_endtag("pre")		self.verbatim -= 1	def handle_data(self, text):		# override		# called for every block of text in HTML source		# If in verbatim mode, save text unaltered;		# otherwise process the text with a series of substitutions		self.pieces.append(self.verbatim and text or self.process(text))	def process(self, text):		# called from handle_data		# Process text block by performing series of regular expression		# substitutions (actual substitions are defined in descendant)		for fromPattern, toPattern in self.subs:			text = re.sub(fromPattern, toPattern, text)		return textclass ChefDialectizer(Dialectizer):	"""convert HTML to Swedish Chef-speak	based on the classic chef.x, copyright (c) 1992, 1993 John Hagerman	"""	subs = ((r'a([nu])', r'u\1'),			(r'A([nu])', r'U\1'),			(r'a\B', r'e'),			(r'A\B', r'E'),			(r'en\b', r'ee'),			(r'\Bew', r'oo'),			(r'\Be\b', r'e-a'),			(r'\be', r'i'),			(r'\bE', r'I'),			(r'\Bf', r'ff'),			(r'\Bir', r'ur'),			(r'(\w*?)i(\w*?)$', r'\1ee\2'),			(r'\bow', r'oo'),			(r'\bo', r'oo'),			(r'\bO', r'Oo'),			(r'the', r'zee'),			(r'The', r'Zee'),			(r'th\b', r't'),			(r'\Btion', r'shun'),			(r'\Bu', r'oo'),			(r'\BU', r'Oo'),			(r'v', r'f'),			(r'V', r'F'),			(r'w', r'w'),			(r'W', r'W'),			(r'([a-z])[.]', r'\1.  Bork Bork Bork!'))class FuddDialectizer(Dialectizer):	"""convert HTML to Elmer Fudd-speak"""	subs = ((r'[rl]', r'w'),			(r'qu', r'qw'),			(r'th\b', r'f'),			(r'th', r'd'),			(r'n[.]', r'n, uh-hah-hah-hah.'))class OldeDialectizer(Dialectizer):	"""convert HTML to mock Middle English"""	subs = ((r'i([bcdfghjklmnpqrstvwxyz])e\b', r'y\1'),			(r'i([bcdfghjklmnpqrstvwxyz])e', r'y\1\1e'),			(r'ick\b', r'yk'),			(r'ia([bcdfghjklmnpqrstvwxyz])', r'e\1e'),			(r'e[ea]([bcdfghjklmnpqrstvwxyz])', r'e\1e'),			(r'([bcdfghjklmnpqrstvwxyz])y', r'\1ee'),			(r'([bcdfghjklmnpqrstvwxyz])er', r'\1re'),			(r'([aeiou])re\b', r'\1r'),			(r'ia([bcdfghjklmnpqrstvwxyz])', r'i\1e'),			(r'tion\b', r'cioun'),			(r'ion\b', r'ioun'),			(r'aid', r'ayde'),			(r'ai', r'ey'),			(r'ay\b', r'y'),			(r'ay', r'ey'),			(r'ant', r'aunt'),			(r'ea', r'ee'),			(r'oa', r'oo'),			(r'ue', r'e'),			(r'oe', r'o'),			(r'ou', r'ow'),			(r'ow', r'ou'),			(r'\bhe', r'hi'),			(r've\b', r'veth'),			(r'se\b', r'e'),			(r"'s\b", r'es'),			(r'ic\b', r'ick'),			(r'ics\b', r'icc'),			(r'ical\b', r'ick'),			(r'tle\b', r'til'),			(r'll\b', r'l'),			(r'ould\b', r'olde'),			(r'own\b', r'oune'),			(r'un\b', r'onne'),			(r'rry\b', r'rye'),			(r'est\b', r'este'),			(r'pt\b', r'pte'),			(r'th\b', r'the'),			(r'ch\b', r'che'),			(r'ss\b', r'sse'),			(r'([wybdp])\b', r'\1e'),			(r'([rnt])\b', r'\1\1e'),			(r'from', r'fro'),			(r'when', r'whan'))def translate(url, dialectName="chef"):	"""fetch URL and translate using dialect	dialect in ("chef", "fudd", "olde")"""	import urllib	sock = urllib.urlopen(url)	htmlSource = sock.read()	sock.close()	parserName = "%sDialectizer" % dialectName.capitalize()	parserClass = globals()[parserName]	parser = parserClass()	parser.feed(htmlSource)	parser.close()	return parser.output()def test(url):	"""test all dialects against URL"""	for dialect in ("chef", "fudd", "olde"):		outfile = "%s.html" % dialect		fsock = open(outfile, "wb")		fsock.write(translate(url, dialect))		fsock.close()		import webbrowser		webbrowser.open_new(outfile)	if __name__ == "__main__":	test("http://diveintopython.org/odbchelper_list.html")
⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -