wp.net.awk

来自「英国剑桥大学开发的新版本语音识别工具开发包HTK。」· AWK 代码 · 共 47 行

AWK
47
字号
{
   if (NF==0) {
      if (ln>990)
	 links=1;
      else if (!ln) {
	 printf("N=%d L=%d\n",nn,nl);
	 stwd="!SENT_START";
	 printf("I=%-4d W=%s\n",0,stwd);
	 enwd="!SENT_END";
	 word="SENTENCE-END";
	 num[word]=1; words[1]=word;
	 printf("I=%-4d W=%s\n",1,enwd);
	 ln=2;
      }
   }
   else if (links) {
      if (substr($1,1,1)==">") {
	 word=substr($1,2,length($1)-1);
      }
      else {
	 like=-log(nfoll[word]);
	 if (word=="SENTENCE-END")
	    printf("J=%-5d S=%-4d E=%-4d l=%.4f\n",la,0,num[$1],like);
	 else
	    printf("J=%-5d S=%-4d E=%-4d l=%.4f\n",la,num[word],num[$1],like);
	 la++;
      }
   }
   else if (ln) {
      if (substr($1,1,1)==">") {
	 word=substr($1,2,length($1)-1);
	 nfoll[word]=0;
	 if (num[word]) {
	    n=num[word];
	 }
	 else {
	    n=ln;
	    num[word]=ln++;
	    printf("I=%-4d W=%s\n",n,word);
	 }
      }
      else
	 nfoll[word]++;
   }
   
}

⌨️ 快捷键说明

复制代码Ctrl + C
搜索代码Ctrl + F
全屏模式F11
增大字号Ctrl + =
减小字号Ctrl + -
显示快捷键?