⭐ 欢迎来到虫虫下载站! | 📦 资源下载 📁 资源专辑 ℹ️ 关于我们
⭐ 虫虫下载站

📄 news2004213225740.htm

📁 92google生成HTML新闻系统.rar
💻 HTM
📖 第 1 页 / 共 2 页
字号:
                     2004年2月13日22:57</font></div></td>
              </tr>
            </table>
            <table width="100%" border="0" cellspacing="0" cellpadding="0" height="25">
              <tr> 
                <td height="20"><img src="/news/images/witer.GIF" width="1" height="1"></td>
              </tr>
            </table>
            <table width="570" border="0" cellspacing="0" cellpadding="0" align="CENTER">
              <tr> 
                <td><H3 class=title>Google遗漏了什么</H3>
<P>许多人以为Google索引了互联网上的一切。不过,Google或许是我们所拥有的最好的搜索引擎,但是,Google所索引的互联网上的资源远比我们想象的要少得很多。根据Google首页面提供的数据,目前,它索引了3,083,324,652个页面,而据估计,实际上在互联网上有达100亿只夺得页面存在。我们不仅要问, 那些被Google省却的页面都是什么呢? <BR>
<P>现在,我们遇到了一个难以提出的问题。如果我们想真实的知道Google到底遗漏了些什么,那我们必须要有一个比Google公司的能力更为强大的索引能力。在我们的此项研究中,作为理解Google索引了什么和遗漏了什么的开端,我们选取了"googlology"这样一个词来追踪, 'Goolology'是Webmaster World在2002年10月第十二期第一次提出来的,续而作为一个词在Microdoc News的前身站点Google Village上被使用,到2003年5月10日,通过Google的查询,该词意共出现在655个页面。然后,我们开始在互联网上到处搜索所有包含有"googlology"的页面,作为我们首次探究Google究竟遗漏了那些的实例,我们发现,"googlology"这个词在当前实际所出现的页面数目要比Google列出的要多。 <BR>
<P>Google从它的数据库中的总共655个页面中列出了624个页面的索引。我们抓取了那些链接的screen-scraped,把它们放入我们的文本数据库中。我们的研究人员设置了WebWolf<A href="http://blogs.51.net/pmwiki/pmwiki.php/Internet/WebWolf?action=edit"><U><FONT color=#003366>?</FONT></U></A>,让这个桌面“爬虫”在互联网上工作了两个星期来猎取那些包含有"googlology"的页面。 我们将网络上多达220,000个链接的Blogging新闻标题作为出发点;我们的爬虫从那里开始,跟随着一个又一个链接,直到它能在互联网上寻遍"googlology"这个词。 <BR>
<P>在两个礼拜的搜索之后,我们找到了2,199个页面包含"googlology"这个词。这也就意味着Google只索引了所有包含有"googlology"这个词的页面的29%。我们发现,另外的1,544包含有"googlology"的页面在Google的数据库中不存在。我们不尽要问,那些抡有被Google索引的页面都是哪些?它们都来自那种类型的站点? <BR>
<P>Microdoc News使用了一个mapping工具来分析我们在搜索中创建的数据库。所有包含有"googlology" (2,199个)的页面用最外圈的犗黑线椭圆被标绘在我们的映射图上。这个大的椭圆里面的整个区域代表那些包含有"googlology"的所有页面。我们对这些页面按照下面的七类进行归类: <BR>
<UL><BR>
<LI>Blog页面 <BR>
<LI>教育类页面 <BR>
<LI>主流媒体站点的页面 <BR>
<LI>新闻,信息和目录页面 <BR>
<LI>Junk <BR>
<LI>Other database by Google <BR>
<LI>Other not-databased by Google <BR>
<P></P></LI></UL>
<P class=title><BR>&nbsp;</P>
<P>结果显示在下面这种映射图中。它为我们提供了一个包含有"googlology",但抡有被Google索引的页面的可视化图景。图中红艊区域标绘了哪些包含有"googlology",并且所有被Google索引的624个页面。 <BR>
<P>正如你所看到的,大约有一半左右包含有"googlology"的blog页面被Google索引,包含有"googlology"的教肊类站点页面中,约有37%被Google索引,类似的,主流媒体站点类页面中,29%被索引,News, Information and Directories类页面中大概是45%,junk站点类中,例如Geocities和其他类似的站点,约有8%被索引。 <BR>
<P>那些被Google数据库所遗漏的页面,看来多是那些用到该术语比较早的页面,例如2002年12月以前,在那里我们发现多达153个包含有该词的教肊类站点页面(它们引用到Webmaster World对该术语的使用),它们没有被Google索引。同样,也有许多在2月到3月之间的blog页面(它们引用到Google Village站点)和许多Microdoc News页面抡有被Google索引。我们还发现在在CNet<A href="http://blogs.51.net/pmwiki/pmwiki.php/Internet/CNet?action=edit"><U><FONT color=#003366>?</FONT></U></A>、ZDNet<A href="http://blogs.51.net/pmwiki/pmwiki.php/Internet/ZDNet?action=edit"><U><FONT color=#003366>?</FONT></U></A>和类似BBC、Siemens和其他媒体类站点的包含有该词的页面没有被列在Google中。 <BR>
<P>根据这些以及我们对数据的进一步分析,要是我们真的把对"googlology"这个词的分析的结果应用到所有的其他词去,那么,我们能得到这样一些试验性的结论: <BR>
<P><BR>
<UL><BR>
<LI>Google并不索引互联网上的每一个页面; <BR>
<LI>Google倾向于抛下(或不索引)那些到现在三到六个月以前或更早的页面; <BR>
<LI>Google倾向于包含blogs、educational以及news and information类站点最新页面(在三个月内创建的页面)中的98%; <BR>
<LI>Google一般会索引主流媒体站点在最近三个月内创建的页面中的80%; <BR>
<LI>Google通常会忽略那些信息量很少的某些类型的站点的页面; <BR>
<P></P></LI></UL>
<P class=title>在网络上有2,199张包含有"googlology"的页面,Google仅仅列出了624张,而Google声称有655张。Google通常抛下较老的页面,它看上去是选择性的,比如"googlology",3个月、6个月或者更早以前的页面中,仍然有一张或更多的页面被索引,而同时,同期的包含其他该词的其他页面被抛下了。 <BR></P>
<P>虽然我们没有非常正规的对该词作研究,但是似乎是在所给的三个月的时期内,第一次包含有"googlology"的页面被Google长期的获留,而同时期的其他包含有"googlology"的页面被逐站的抛下。因此结果是,我们能在Webmaster World找到使用"googlology"的页面,特别是它第一次使用的页面,但是并不能发现在接下来的10、11、12月中所有的包含"googlology"的页面。我们能找到Google Village和Microdoc News中包含"googlology"的页面,但并不是所有的情况,在一月到三月这段时间,在Google数据库中,我们站点自己的页面仅出现一次,其他的全部都抡被数据库收进。 <BR>
<P>用什么描绘来比拟Google搜索引擎是什么样的呢?我们想Google像是一束巨大的搜索的光芒,很像地球上看到的太阳的光亮。它的光指向它所作用到的地方,and what else is going on, 例如象互联网上的多数静态部分,Google索引抛下引用到它们那里的引用。静态的意思是,那些页面抡有被更新,或者作任何的变动,也许是没有被个人搜索到。出现在Google的数据库中的,并不意味着它总是在那里。似乎是Google数据库频繁的将一些页面刨除。Google所索引的30亿或更多的页面看上去是互联网上最为重要的30亿个页面。Google所抛下的,是那些抡有被更新或者常被用到的页面,就像我那些六个月以前的老文章。</P></td>
              </tr>
            </table>
            <table width="540" border="0" cellspacing="0" cellpadding="0" align="CENTER" height="20">
              <tr> 
                <td> </td>
              </tr>
            </table>
            <div align="CENTER"></div>
            <table width="520" border="0" cellspacing="0" cellpadding="0" align="CENTER" height="20">
              <tr> 
                <td>(编辑:<font face="Arial, Helvetica, sans-serif">admin</font>)</td>
              </tr>
            </table>
            <div align="CENTER"> 
              <table width="540" border="0" cellspacing="0" cellpadding="0" align="CENTER" height="20">
                <tr> 
                  <td><a href="http://www.92google.com">92google.com</a></td>
                </tr>
              </table>
            </div></td>
        </tr>
      </table>
    </td>
    <td width="160" valign="top" bgcolor="#E3E3E3"> 
      <table width="100%" border="0" cellspacing="0" cellpadding="0">
        <tr> 
          <td valign="TOP" bgcolor="#A0CFD8"> 
            <table width="100%" border="0" cellspacing="0" cellpadding="3" bgcolor="#AFAFAF">
              <tr> 
                <td width="21"> 
                  <div align="CENTER"></div>
                </td>
                <td width="127">文章搜索</td>
              </tr>
            </table>
          </td>
        </tr>
      </table>
      <table width="100%" border="0" cellspacing="0" cellpadding="0">
        <tr> 
          <td>
            
           
</td>
        </tr><tr > 
              <td colspan="2" align="center"> 
<form action="../search.asp" method="post">
                  <input type=text size=12 name="keyword">
                  <input type=submit value="搜索" name="submit">
                  <input type=hidden name=datesearch value=all>
                  <input type="hidden" name="AreaSearch" value=1>
</form>
                </td>
            </tr>
           
      </table>
      <table width="100%" height="53" border="0">
        <tr>
          <td height="49"><p><font color="#FF0000">欢迎在此投放广告,我们以最低的价格,为您提供最优质的服务</font></p>
            <p><font color="#FF0000">联系人:程先生</font></p>
            <p><font color="#FF0000">QQ:1608293</font></p>
            <p><font color="#FF0000">E-mail:chengyi0747@163.com</font></p></td>
        </tr>
      </table>
    </td>
  </tr>
</table>
<table width="750" border="0" cellspacing="0" cellpadding="0" align="center">
  <tr> 
    <td colspan="7" height="2"> 
      <table border=0 cellpadding=0 cellspacing=0 height=5 
            width="100%">
        <tr align=middle  valign=center> 
          <td  height=5 bgcolor="#FFFFFF"> 
            <table width="100%" border="0" cellspacing="0" cellpadding="0" align="center">
              <tr> 
                <td height="3" background="/main/dot_line.gif"><img src="main/dot_line.gif" width="3" height="3"></td>
              </tr>
            </table>
          </td>
        </tr>
        <tbody> 
        <tr align=middle  valign=center> 
          <td  height=5 bgcolor="#996600"><img height=1 src="" 
              width=1></td>
        </tr>
        </tbody> 
      </table>
    </td>
  </tr>
  <tr> 
    <td colspan="7" height="20"> 
      <div align="center"> 
        <div align="center"><a href="http://www.92google.com"><strong>排名优化</strong></a> 
          <strong><a href="http://www.92google.com">Google排名</a> <a href="http://www.92google.com">网络营销专业知识</a></strong><br>
          <a href="http://www.92google.com/copyright.htm">版权声明</a> | <a href="http://www.92google.com/lianxi.htm">联系我们</a> 
          | <a href="http://www.92google.com/guanggao.htm">刊登广告 </a>| <a href="http://www.92google.com/help.htm">使用说明</a> | <a href="http://www.92google.com/guanyu.htm">关于本站 </a>
          | <a href="http://www.92google.com/tiaokuan.htm">豁免条款</a></div>
        </div>
    </td>
  </tr>
  <tr> 
    <td colspan="7" height="20"> 
      <div align="center"><font size="2" class="unnamed1" color="#FF0000">Copyright 
        2004 <a href="http://www.92google.com">www.92google.com</a> All rights 
        reserved</font></div>
    </td>
  </tr>
</table>
</body>
</html>

⌨️ 快捷键说明

复制代码 Ctrl + C
搜索代码 Ctrl + F
全屏模式 F11
切换主题 Ctrl + Shift + D
显示快捷键 ?
增大字号 Ctrl + =
减小字号 Ctrl + -