⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 history.txt

📁 documents classification and words statiscs TF/IDF etc
💻 TXT
字号:
**************************************************                                         ******   TextSTAT - Simples Text Analyse Tool  ******   (c) Matthias H黱ing 2001-2008         ******                                         ******   膎derungsprotokoll / History          ******                                         ***************************************************** Version 2.8c: 26.09.2008 ***- 'UTF-16' als Kodierung hinzugef黦t (auf dringenden Wunsch eines Benutzers)- neue Oberfl鋍hensprache hinzugef黦t: Galizisch; Dank an Gon鏰lo Cordeiro <gzcordeiro@gmail.com>- Export nach .csv oder .txt kodiert die Resultate jetzt standard als UTF-8 (die Kodierungseinstellung des Programms wird beim Export nicht mehr ber點ksichtigt)*** Version 2.8b: 23.09.2008 ***- Sieht so aus, als w鋜e der fatale Bug unter Linux jetzt identifiziert und behoben. Auch unter Linux k鰊nen (wieder) Files ge鰂fnet und hinzugef黦t werden (Bug im Zusammenspiel von 'locale' und 'tkFileDialog'; letztlich hing auch die nicht-funktionierende Backspace-Taste mit den locale-Settings zusammen; daher konnte der Workaround (MyEntry-Klasse) wieder aus dem Programm genommen werden*** Version 2.8a: 05.09.2008 ***- Bug behoben: beim Importieren von Texten f黨rte ein Unicode-Konvertierungsfehler dazu, dass die Datei 黚erhaupt nicht geladen wurde. Jetzt werden nicht-konvertierbare Zeichen ersetzt (durch das Unicode-Ersetzungszeichen)*** Version 2.8: 21.08.2008 ***- Windows: MS-Word 2007-Files k鰊nen jetzt direkt in ein Korpus eingef黦t werden (wenn Word 2007 auf dem Rechner installiert ist)- St鰎ender Bug beim Hinzuf黦en von Dateien unter Windows behoben (Pfadname wurde unter bestimmten Bedingungen falsch interpretiert)- Backspace-Bug behoben: die Backspace-Taste funktioniert in Eingabefeldern jetzt (wieder) wie gewohnt*** Version 2.7a: 10.06.2008 ***- Franz鰏isch als Oberfl鋍hensprache hinzugef黦t; Dank an Robert Caron <robert.caron@wanadoo.fr>*** Version 2.7: 03.01.2007 ***- Bug-Fixes; insbesondere f黵 MACs - zwei kleinere Patches von Stian Haklev (shaklev@gemail.com) eingearbeitet- 'Recent Files' hinzugef黦t (Patch von Stian Haklev)*** Version 2.6a: 20.11.2005 ***- Portugiesisch als Oberfl鋍hensprache hinzugef黦t; Dank an Hugo Sunayama <hugocogeae@yahoo.com.br>- kleinere Bug-Fixes und Erg鋘gzungen (u.a. zu den 'encodings')*** Version 2.6: 10.10.2005 ***- Filter f黵 neues OpenOffice-Format hinzugef黦t (Open Document: .odt)- Wenn Gro遱chreibung hier ignoriert wird, dann sollte sie auch bei den Konkordanzen ignoriert werden... Ist jetzt Default.- Web-Spider akzeptiert jetzt auch '.cfm'-Files.- andere kleine Bug-Fixes*** Version 2.5: 20.09.2004 ***- Dies sollte jetzt mal wieder eine stabile Version sein, die die n鋍hsten Wochen und Monate nicht mehr ge鋘dert wird.- 'Korpus l鰏chen' funktionierte nicht mehr. Repariert.- Nachfrage eingebaut (Korpus speichern?), wenn ge鋘dertes Korpus f黵 anderes/neues Korpus geschlossen werden soll; auch beim Beenden des Programms gibt es diese Nachfrage nur noch, wenn das Korpus ge鋘dert wurde- viele kleinere 膎derungen*** Version 2.4a: 16.09.2004 ***- Bug beim Import von MS Word-Dokumenten, wenn mehrer Dokumente gleichzeitig zu einem Korpus hinzugeladen wurden gab es Probleme. Behoben (hoffentlich).- Alphabetisch sortieren (mit Unicode und Locale) scheint jetzt (endlich) zu funktionieren; daf黵 ist allerdings ein h溥licher Workaround n鰐ig... (in Korpus.py)- Horizontales Scrollen in Dateiliste jetzt m鰃lich...- ... und einige andere 'Sch鰊heitsfehler' behoben- Und wieder: Danke Nikos Kouremenos!! (er hat den Bug gefunden und viele kleinere Verbesserungsvorschl鋑e gemacht)*** Version 2.4: 06.09.2004 ***- OpenOffice-Files k鰊nen jetzt direkt in in Korpus eingelesen werden (Dateiendung '.sxw'); Dank an Nikos Kouremenos f黵 die Anregung und f黵 das Testen unter Linux!  - Unter Windows k鰊nen jetzt auch Word-Files direkt in ein Korpus eingelesen werden (vorausgesetzt die Python-Win32Extensions sowie MS Word sind installiert und der Dateiname hat die Endung '.doc' oder '.rtf' ...)- Beim Anlegen eines neuen Korpus wird jetzt ein Hinweis ausgegeben, doch bitte auf die richtige Dateikodierung zu achten- Regul鋜en Ausdruck zur Ermittlung der W鰎ter in einem Text ge鋘dert: In einem "Wort" darf jetzt auch ein Apostroph stehen ("don't" etc. z鋒len also jetzt als Wort). Dank an Clint Howarth f黵 Hinweis und RE!- Im Korpus sind die db-keys jetzt in utf-8*** Version 2.3a: 16.08.2004 ***- Bugfix: durch eine 膎derung im Sprachressourcen-File gab es beim Export (.txt oder .doc) einen Unicode-Fehler -- behoben. (Hinweis von Stefan Kreslin, Australien. Danke!)- Das Programm merkt sich jetzt die Einstellung der Filekodierung *** Version 2.3: 12.08.2004 ***- Neuer Dialog: TextDialog. Zeigt 'History.txt' und 'License.txt' an (Menu > ?)- Kleine Layout-膎derungen an den Dialogen (News, Web, Query); Titel hinzugef黦t; Anzahl ausw鋒len jetzt mit 'Spinbox'- Aktiver Tab wird jetzt auch farblich hervorgehoben (膎derung in TabPage.py)- Dialog beim Beenden des Programms: 'Cancel'-M鰃lichkeit hinzugef黦t- Bug: Fehler beim 謋fnen von Dateien mit nicht-Latin-1-Zeichen im Dateinamen. Behoben (zumindest teilweise - unter Linux scheint das immer noch problematisch zu sein). (Hinweis von Nikos Kouremenos, Griechenland. Danke!)*** Version 2.2a: 18.06.2004 ***- ernster, wenn auch kleiner Bug: in den Sprachoptionen fehlte eine 躡ersetzung; daher konnte die Sprache nicht auf Englisch oder Niederl鋘disch umgestellt werden. Behoben. (Dank an Terry Pakcik, Malaysia, f黵 den Hinweis.)- Dateiname des aktiven Korpus wird jetzt in der Titelzeile des Fensters angezeigt*** Version 2.2: 13.06.2004 ***- Query Editor (Suchanfragen-Editor) hinzugef黦t, der das Erstellen von 'Regular Expressions' erleichtern soll- Optionen auf Konkordanz-Tab jetzt rechts zusammengefasst- Textfelder ('Entry') zur Eingabe von Kontextgr鲞e bzw. Frequenz durch 'Spinbox' ersetzt- Neuer Men黳unkt: 'Hilfe' bzw. '?', hier auch Link zur Seite 黚er 'Regular Expressions' auf python.org eingef黦t- Bug in 'Konkordanzen > Aktualisieren': Fehler, wenn kein Suchbegriff da war; wird jetzt abgefangen- kleinere Sch鰊heitsfehler beseitigt*** Version 2.1a: 30.05.2004 ***- Default-Endungen f黵 Dateinamen (.crp und f黵 Export: .csv und .txt)- Kopieren in Zwischenablage: Fehler behoben wenn (im Zitat) kein Text ausgew鋒lt ist (gibt jetzt eine Warnung)*** Version 2.1: 27.05.2004 ***- schwerer Fehler beim Abspeichern von Optionen behoben (Unicode-Pfadnamen wurden vom ConfigParser nicht richtig abgespeichert, daher liessen sich Korpora u.U. nicht abspeichern); L鰏ung: ConfigParser durch ein einfaches 'Dictionary' ersetzt, das mittels cPickle gespeichert und eingelesen wird (Hinweis von Michael Sauer - Danke!)*** Version 2.0a: 08.02.2004 ***- 膎derung der Listendarstellung (verwendet jetzt MultiListbox)- viele kleine Bugfixes*** Version 2.0: 30.12.2003 ***- komplette 躡erarbeitung des Programms- Redesign der Oberfl鋍he, Verzicht auf externe Module (vor allem PMW): TextSTAT l鋟ft jetzt ohne weitere Zusatzmodule mit der Standard Python-Distribution; Einf黦en einer Toolbar- viel bessere und systematischere Trennung von GUI-Code und Korpus-Code- Sprachen: leider keine franz鰏ische Version mehr, daf黵 jetzt aber eine niederl鋘dische- TextSTAT wird jetzt (auch) als Sourcecode zur Verf黦ung gestellt- Lizenz in License.txt************************************************** Version 1.52: 01.05.2003 ***- neue, effizientere Funktion zum Einlesen und Splitten eingebaut (s. Python-Cookbook S. 129) - 'Ordner 鰂fnen' entfernt jetzt automatisch HTML-Codes aus Dateien (*.html oder *.htm).*** Version 1.51: 01.12.2002 ***- Fehler behoben (beim Suchen nach 'ganzen W鰎tern' wurden das erste und das letzte Wort eines Textes nicht ber點ksichtigt) *** Version 1.5: 07.10.2002 ***- neue M鰃lichkeit: einen ganzen Ordner zu einem Korpus hinzuzuf黦en - kleinere 'Sch鰊heitsreparaturen' *** Version 1.4: 20.02.2002 ***- Option 'Resultate speichern' hinzugef黦t (Kodierung orientiert sich dabei an der Option 'Datei-Kodierung') - Option 'Resultate > MS Word' hinzugef黦t: wenn Word auf dem System vorhanden ist, wird das Programm gestartet, und der Inhalt der Tab-Bl鋞ter wird in ein leeres Dokument bernommen - Option 'Resultate > MS Excel' hinzugef黦t: wenn Excel auf dem System vorhanden ist, wird das Programm gestartet, und die Wortformen und Frequenzangaben werden in ein leeres Dokument 黚ernommen - In der Worformen-Frequenzliste kann der anzuzeigende Frequenzbereich jetzt eingegrenzt werden *** Version 1.3: 11.01.2002 ***- das Programm arbeitet jetzt (intern) mit Unicode, dadurch k鰊nen auch Texte in anderen Kodierungen werden als Latin-1 verarbeitet werden; die jeweilige File-Kodierung muss aber beim Einlesen angegeben (s. neuen Men黳unkt 'Optionen > Datei-Kodierung'). Auch das Korpus-Tool konvertiert jetzt alles nach Unicode. - Sprache des Programms kann jetzt ge鋘dert werden (Optionen > Sprache 鋘dern) - Neue Option im Korpus Tool: Suchbereich des Spiders kann jetzt ver鋘dert werden (Server oder Subdirectory) - Erste Version einer Doku f黵 erstellt (= dieser Text) *** Version 1.2: 08.12.2001 ***- Korpus wird nicht mehr nach jedem Hinzuf黦en einer Datei neu analysiert (dauerte zu lange) - 'Korpus Tool' hinzugef黦t (Web-Spider, News-Grabber -> Korpus) - 'Statistik' entfernt (weil nichtssagend...) - 'Progress Bar' hinzugef黦t - String-Modul durch String-Methoden ersetzt *** Version 1.1: 14.08.2001 ***- Sortierfunktionen ge鋘dert: verwenden jetzt locale.strcoll() und sortieren nach den Regeln der jeweiligen Sprache (des Betriebssystems) - im Zitatfenster kann jetzt die jeweilige Datei mit Doppelklick ge鰂fnet werden - es k鰊nen mehrere HTML-Files gleichzeitig hinzugef黦t werden - Korpus wird jetzt nicht mehr als Dictionary sondern als Liste verwaltet (wegen der Reihenfolge usw.). Dadurch sind allerdings gespeicherte Korpora der vorherigen Version nicht mehr verwendbar... :-( - Einige Optionen werden bei 'Beenden' gespeichert *** Version 1.0: 26.07.2001 ***- erste '鰂fentliche Version' - Lesen von HTML-Seiten jetzt auch von Festplatte - Entfernen von HTML-Codes nochmal verbessert - Standardschrift f黵 Interface umgestellt auf Verdana - Men黣intrag mit Link zur Homepage eingef黦t *** Version 0.9: 24.07.2001 ***- besseres Verfahren zum Entfernen von HTML-Code aus Webseiten - es k鰊nen jetzt beliebig viele Korpora gespeichert werden (statt nur einem) *** Version 0.8: 20.07.2001 ***- es k鰊nen Webseiten hinzugef黦t werden - das aktuelle Korpus kann gespeichert werden *** Erste experimentelle Version: September 2000 **************************************************

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -