本项目旨在实现一个名为NKU InfoHub信息检索系统。该系统通过爬虫整合了南开大学新闻网等11个网站的数10w条网页、文档等信息,供用户查询和获取有关南开大学的新闻、课程、课外活动等信息,提高信息获取的效率。 数据获取与预处理:使用 Python 编写爬虫程序 ...