filterv.py

来自「orange源码数据挖掘技术」· Python 代码 · 共 221 行
221 行
import orange


############ THIS IS WHAT YOU CAN DO WITH DISCRETE ATTRIBUTES

data = orange.ExampleTable("lenses")

############ THIS IS WHAT YOU CAN DO WITH DISCRETE ATTRIBUTES

print "\nYoung or presbyopic with astigmatism"
fya = orange.Filter_values(domain = data.domain)
fya["age"] = "young"
print "\nYoung examples\n"
for ex in fya(data):
    print ex

fya["age"] = "presbyopic"
print "\n\nPresbyopic examples\n"
for ex in fya(data):
    print ex


fya["age"] = ["presbyopic", "young"]
print "\n\nYoung and presbyopic examples\n"
for ex in fya(data):
    print ex

astigm = data.domain["astigmatic"]
fya["age"] = ["presbyopic", "young"]
fya[astigm] = "yes"
print "\n\nYoung and presbyopic examples that are astigmatic\n"
for ex in fya(data):
    print ex

fr = orange.Filter_values(domain = data.domain)
fr[3] = "reduced"

# Conjunction is not necessary here - we could still do this with a single filter
fcon = orange.Filter_conjunction([fya, fr])
print "\n\nYoung and presbyopic examples that are astigmatic and have reduced tear rate\n"
for ex in fcon(data):
    print ex

fcon = orange.Filter_disjunction([fya, fr])
print "\n\nYoung and presbyopic asticmatic examples and examples that have reduced tear rate\n"
for ex in fcon(data):
    print ex


############ THIS IS WHAT YOU CAN DO WITH CONTINUOUS ATTRIBUTES

data = orange.ExampleTable("iris")

fcont = orange.Filter_values(domain = data.domain)
fcont[0] = (orange.ValueFilter.Equal, 4.59999999999999) # This is to check that rounding errors don't hurt
print "\n\nThe first attribute equals 4.6"
for ex in fcont(data):
    print ex

fcont[0] = (orange.ValueFilter.Less, 4.6)
print "\n\nThe first attribute is less than 4.6"
for ex in fcont(data):
    print ex

fcont[0] = (orange.ValueFilter.LessEqual, 4.6)
print "\n\nThe first attribute is less than or equal to 4.6"
for ex in fcont(data):
    print ex

fcont[0] = (orange.ValueFilter.Greater, 7.6)
print "\n\nThe first attribute is greater than 7.6"
for ex in fcont(data):
    print ex

fcont[0] = (orange.ValueFilter.GreaterEqual, 7.6)
print "\n\nThe first attribute is greater than or equal to 7.6"
for ex in fcont(data):
    print ex

fcont[0] = (orange.ValueFilter.Between, 4.6, 5.0)
print "\n\nThe first attribute is between to 4.5 and 5.0"
for ex in fcont(data):
    print ex

fcont[0] = (orange.ValueFilter.Outside, 4.6, 7.5)
print "\n\nThe first attribute is between to 4.5 and 5.0"
for ex in fcont(data):
    print ex


############ THIS IS WHAT YOU CAN DO WITH STRING ATTRIBUTES

data.domain.addmeta(orange.newmetaid(), orange.StringVariable("name"))
for ex in data:
    ex["name"] = str(ex.getclass())

fstr = orange.Filter_values(domain = data.domain)
fstr["name"] = "Iris-setosa"
print "\n\nSetosae"
d = fstr(data)
print "%i examples, starting with %s" % (len(d), d[0])

fstr["name"] = ["Iris-setosa", "Iris-virginica"]
print "\n\nSetosae and virginicae"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = ["Iris-setosa", "Iris-viRGInica"]
fstr["name"].caseSensitive = 1
print "\n\nSetosae and viRGInicae (case sensitive)"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = ["Iris-setosa", "Iris-viRGInica"]
fstr["name"].caseSensitive = 0
print "\n\nSetosae and viRGInicae (case insensitive)"
d = fstr(data)

print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])
fstr["name"] = (orange.Filter_values.Less, "Iris-versicolor")
print "\n\nLess than versicolor"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.LessEqual, "Iris-versicolor")
print "\n\nLess or equal versicolor"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.Greater, "Iris-versicolor")
print "\n\nGreater than versicolor"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.GreaterEqual, "Iris-versicolor")
print "\n\nGreater or equal versicolor"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.Between, "Iris-versicolor", "Iris-virginica")
print "\n\nGreater or equal versicolor"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.Contains, "ers")
print "\n\nContains 'ers'"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.NotContains, "ers")
print "\n\nDoesn't contain 'ers'"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.BeginsWith, "Iris-ve")
print "\n\nBegins with 'Iris-ve'"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.EndsWith, "olor")
print "\n\nEnds with with 'olor'"
d = fstr(data)
print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.EndsWith, "a"*50)
print "\n\nBegins with '%s'" % ("a"*50)
d = fstr(data)
if not len(d):
    print "<empty table>"
else:
    print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr = orange.Filter_values(domain=data.domain)
fstr["name"] = (orange.Filter_values.BeginsWith, "Iris-VE")
fstr["name"].caseSensitive = 1
print "\n\nBegins with 'Iris-VE' (case sensitive)"
d = fstr(data)
if not len(d):
    print "<empty table>"
else:
    print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])

fstr["name"] = (orange.Filter_values.BeginsWith, "Iris-VE")
fstr["name"].caseSensitive = 0
print "\n\nBegins with 'Iris-VE' (case insensitive)"
d = fstr(data)
if not len(d):
    print "<empty table>"
else:
    print "%i examples, starting with %s\n  finishing with %s" % (len(d), d[0], d[-1])



###### REFERENCES vs. COPIES OF EXAMPLES

data = orange.ExampleTable("lenses")

print "\nYoung or presbyopic with astigmatism - as references"
fya = orange.Filter_values(domain = data.domain)
fya["age"] = "young"
print "\nYoung examples\n"
d2 = fya(data, 1)
for ex in fya(d2):
    print ex

print "\nTesting whether this is really a reference"
d2[0][0] = "?"
print data[0]

print "\nTesting that we don't have references when not requested"
d2 = fya(data)
d2[1][0] = "?"
print data[1]

###### COUNTS OF EXAMPLES

data = orange.ExampleTable("lenses")
fya = orange.Filter_values(domain = data.domain)
fya["age"] = "young"
print "The data contains %i young fellows" % fya.count(data)
filterv.py - 源码说明

本页面展示了「orange源码数据挖掘技术」中的 filterv.py 源码文件，采用 Python 编程语言编写，共 221 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。
虫虫下载站收录了大量与orange相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。
⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?