url_keyboard.cpp

来自「用STL实现的交叉引用程序」· C++ 代码 · 共 190 行

CPP

190 行

#pragma warning(disable:4786)
#include <iostream>
#include <vector>
#include <string>
#include <map>
#include <algorithm>
#include <cctype>
#include <iterator>
#include <fstream>
using namespace std;

//如果参数是空白区域则为true(真),false(假)
bool space(char c)
{
	return isspace(c);
}

//如果参数是空白区域则为false(假),true(真)
bool not_space(char c)
{
	return !isspace(c);
}

//把输入行分割成单词
vector<string> split(const string& str)
{
	typedef string::const_iterator iter;
	vector<string> ret;

	iter i=str.begin();
	while(i!=str.end())
	{
		//忽略前端的空白
		i=find_if(i,str.end(),not_space);

		//找出单词的结尾
		iter j=find_if(i,str.end(),space);

		//复制在[i,j]中的字符
		if(i!=str.end())
			ret.push_back(string(i,j));

		//进入下一个单词的查找
		i=j;
	}
	return ret;
}

bool not_url_char(char c)
{
	//除了字母数字以外,其他有可能出现在一个URL中的字符
	static const string url_ch="~;/?:@&$-_.+!*'(),";
	
	//看c是否能出现在一个URL中并返回求反的结果
	return !(isalnum(c)||find(url_ch.begin(),url_ch.end(),c)!=url_ch.end());//isalnum(c)说明字符c是字母或数字
}

string::const_iterator url_end(string::const_iterator b,string::const_iterator e)
{
	return find_if(b,e,not_url_char);
}

string::const_iterator url_beg(string::const_iterator b,string::const_iterator e)
{
	static const string sep="://";

	typedef string::const_iterator iter;

	//i标记了查找到的分隔符的位置
	iter i=b;

	while((i=search(i,e,sep.begin(),sep.end()))!=e)
	{
		//确保分隔符不是本行中的惟一的一个符号
		if(i!=b&&i+sep.size()!=e)
		{
			//beg标记协议名称的开头
			iter beg=i;
			while(beg!=b&&isalpha(beg[-1]))//isalpha(c)说明c是一个字符;beg[-1]是*(beg-1)的简写
				--beg;

            //在分隔符前面及后面有一个字符吗?
			if(beg!=i&&i+sep.size()!=e&&!not_url_char(i[sep.size()]))//只需判断后面,因为前面由isalpha(c)判断过了;i[sep.size()]是*(i+sep.size())的一个简写
				return beg;
		}

		//我们找到的分隔符不是一个URL的一部分
		if(i!=e)
			i+=sep.size();
	}
	return e;
}

vector<string> find_urls(const string& s)
{
	vector<string>ret;
	typedef string::const_iterator iter;//简化迭代器类型名
	iter b=s.begin(),e=s.end();

	//检查整个输入
	while(b!=e)
	{
		//检查一个或多个紧跟着://的字母
		b=url_beg(b,e);

		//如果查找成功
		if(b!=e)
		{
			//获取URL的其余部分
			iter after=url_end(b,e);

			//记住这个URL
			ret.push_back(string(b,after));

			//将b向前推进并查找位于本行中的其他URL
			b=after;
		}
	}
	return ret;

}

//查找指向输入中每一个单词的所有行
map<string,vector<int> > xref(istream& in,vector<string>find_words(const string&)=split)
{
	string line;
	int line_number=0;//行编号
	map<string,vector<int> >ret;

	bool flag=true;
	
	//从键盘读入
	while(flag)
	{
		getline(in,line);//读入一行,按回车结束一行的输入,并把整行存放到line中
		
		if(line.compare("exit")==0)//输入exit表示全文输入结束
			break;
		
		++line_number;

		//把输入行分割成单词
		vector<string>words=find_words(line);

		//记住出现在当前行的每一个单词
		for(vector<string>::iterator it=words.begin();it!=words.end();++it)
		
			ret[*it].push_back(line_number);
		
	}
	return ret;
}

	
void main()
{
   
	//
	map<string,vector<int> > ret=xref(cin,find_urls);//cin直接从键盘输入
	
    map<string,vector<int> >::iterator it;

	//输出结果
	for(it=ret.begin();it!=ret.end();++it)
	{
		//输出单词
		cout<<it->first<<" occurs on lines(s): ";

		//后面跟着一个或多个行编号
		vector<int>::iterator line_it=it->second.begin();
		cout<<*line_it;//输出第一个行编号

		++line_it;

		//如果有的话输出其余行编号
		while(line_it!=it->second.end())
		{
			cout<<", "<<*line_it;//行编号用逗号隔开,并且末尾没有多余的逗号
			++line_it;
		}
		//换一个新行以便把每一个单词与下一个分隔开来
		cout<<endl;
	}
}

url_keyboard.cpp - 源码说明

本页面展示了「用STL实现的交叉引用程序」中的 url_keyboard.cpp 源码文件，采用 C++ 编程语言编写，共 190 行代码。您可以在线阅读完整代码内容，也可以返回资源详情页下载完整源码包进行本地学习和开发。

虫虫开发者社区收录了大量与STL相关的技术资源，包括源代码、技术文档、电路图等，是电子工程师和嵌入式开发者的专业学习平台。

⌨️ 快捷键说明

复制代码Ctrl + C

搜索代码Ctrl + F

全屏模式F11

增大字号Ctrl + =

减小字号Ctrl + -

显示快捷键?