wp.net.awk

来自「HTK应用程序」· AWK 代码 · 共 47 行

AWK
47
字号
{   if (NF==0) {      if (ln>990)	 links=1;      else if (!ln) {	 printf("N=%d L=%d\n",nn,nl);	 stwd="!SENT_START";	 printf("I=%-4d W=%s\n",0,stwd);	 enwd="!SENT_END";	 word="SENTENCE-END";	 num[word]=1; words[1]=word;	 printf("I=%-4d W=%s\n",1,enwd);	 ln=2;      }   }   else if (links) {      if (substr($1,1,1)==">") {	 word=substr($1,2,length($1)-1);      }      else {	 like=-log(nfoll[word]);	 if (word=="SENTENCE-END")	    printf("J=%-5d S=%-4d E=%-4d l=%.4f\n",la,0,num[$1],like);	 else	    printf("J=%-5d S=%-4d E=%-4d l=%.4f\n",la,num[word],num[$1],like);	 la++;      }   }   else if (ln) {      if (substr($1,1,1)==">") {	 word=substr($1,2,length($1)-1);	 nfoll[word]=0;	 if (num[word]) {	    n=num[word];	 }	 else {	    n=ln;	    num[word]=ln++;	    printf("I=%-4d W=%s\n",n,word);	 }      }      else	 nfoll[word]++;   }   }

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?