好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

《数据采集》-中级-题库及答案.docx

6页
  • 卖家[上传人]:sat****105
  • 文档编号:265683243
  • 上传时间:2022-03-14
  • 文档格式:DOCX
  • 文档大小:29.78KB
  • / 6 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 中级项目一一、填空题1、网络爬虫是模拟客户端(浏览器)发送____网络____请求,获取响应,并按照自定义的规则____提取____数据的程序 2、通用网络爬虫又称____全网爬虫____,爬行对象由一批种子URL扩充至整个Web 3、Web页面按存在方式分为____表层网页____和____深层网页____ 4、在爬虫过程中一般使用____ http____库向目标站点发送请求,即发送一个____ Request____,该请求中包含___请求头 _____和____请求体____ 5、Scrapy是一个为了实现____挖掘____数据,____监测____数据而设计____爬虫____框架 二、选择题1、网络爬虫按照系统结构和实现技术,大致可以分为(C )种 A、1 B、2 C、3 D、4 2、用户获取网络数据有(C )种方式 A、1 B、2 C、3 D、4 3、用Scrapy框架进行爬虫非常简单,只需要( C)个步骤即可实现一个Scrapy爬虫 A、1 B、2 C、3 D、4 4、以下用于创建爬虫文件的命令是( A)。

      A、fetch B、shell C、view D、bench 5、以下spider参数中用于爬取一般网站的是( D)A、CrawlSpider B、XMLFeedSpider C、CSVFeedSpider D、SitemapSpider项目二一、填空题1、在操作系统中,操作系统的结构可以分为____整体式结构____、____模块化结构____、___层次式结构_____以及____微内核结构____ 2、进程是指一个____程序____以及_____其数据_______上执行时发生的所有活动,是系统资源分配和调度的一个_____独立单位_______进程与程序是不相同的,一个程序在运行时会产生进程 3、在操作系统中,两个或者两个以上的进程请求相同资源而引起的无休止的相互等待的过程叫做_____死锁______允许进程动态地申请系统资源,如果请求的系统资源正在被占用,就会令进程等待 4、在Windows操作系统中使用____win+R____快捷键调用运行窗口来执行命令 5、Windows系统中自带了一个叫做事件查看器的工具,它可以用来查看分析所有的Windows系统日志,使用命令_____ eventvwr_____可以打开它。

      二、选择题1、用鼠标拖动的方式进行复制操作时,选定文本后,( A )拖动鼠标到目标位置A、按Ctrl同时B、按Shift同时C、按Alt同时D、不按任何键2、因特网上专门提供网上搜索的工具叫( C )A、查找B、查询C、搜索引擎D、查看3、在Internet网中,域名的正确形式是(C )A、www\pku\edu\cn B、ftp@uestc@comC、 D、mic/edu/com/cn4、在Windows中文版环境下,中文输入法的启动与关闭可按(A )键A、Ctrl +ShifT B、Ctrl+AItC、Ctrl+spaceD、Alt+Space5、windows中能更改文件名的操作是( D )A、用鼠标左键单击文件名,然后选择“重命名”,键入新文件名后,回车B、用鼠标左键单击文件名,然后在快捷菜单中选“重命名”,键入新文件名,回车C、用鼠标左键双击文件名,然后选择“重命名”,键入新文件名,回车D、用鼠标右键双击文件名,然后选择“重命名”,键入新文件中,回车6、在Windows中,对文件夹进行复制时,(C )A、只复制文件夹名,不复制其内容B、只复制文件夹名和其下的文件,不复制其下的文件夹C、复制文件夹名的其下所有的文件和子文件夹D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文件项目三一、填空题1、 在Linux系统中,以___文件___方式访问设备 。

      2、 Linux内核引导时,从文件____ /etc/fstab____中读取要加载的文件系统3、 Linux文件系统中每个文件用____索引节点____来标识4、 全部磁盘块由四个部分组成,分别为___引导块___、____专用块___、____ i节点表块____和数据存储块5、 链接分为:___硬链接____和___软链接____6、 前台起动的进程使用____ Ctrl+C ____终止7、 静态路由设定后,若网络拓扑结构发生变化,需由___系统管理员____修改路由的设置8、 网络管理通常由__控制____、___监控___和管理三部分组成,其中管理部分是整个网络管理的中心9、 Ping命令可以测试网络中本机系统是否能到达一台__一台远程主机____,所以常常用于测试网络的 连通性 10、vi编辑器具有两种工作模式:__命令模式___和__输入模式___二、选择题1、在登录Linux时,一个具有唯一进程ID号的shell将被调用,这个ID是什么(B)?A、NIDB、PIDC、UIDD、CID2、下面哪个目录存放用户密码信息(B)A、/bootB、/etcC、/varD、/dev3、(D)不是流行的Linux操作系统。

      A、Red Hat LinuxB、Mac OSC、Ubuntu LinuxD、Red Flag Linux4、关闭linux系统(不重新启动)可使用命令 (B) A、Ctrl+Alt+DelB、haltC、shutdown -r nowD、reboot5、用自动补全功能时,输入命令名或文件名的前1个或几个字母后按什么键?(B)A、【Ctrl】键B、【Tab】键C、【Alt】键D、【Esc】键6、在vi中退出不保存的命令是?(AD)A、:qB、:wC、:wqD、:q!7、下面哪个Linux命令可以一次显示一页内容?(C)A、pauseB、catC、moreD、grep8、pwd命令功能是什么? (C )A、设置用户的口令B、显示用户的口令C、显示当前目录的绝对路径D、查看当前目录的文件项目四一、 选择题1、以下不是Apache2.0版本的特点的选项是( D )A、增强了apache的跨平台移植性B、提高了服务器的稳定性C、增强模块功能D、提高了分布式的能力2、在Linux下安装好httpd服务器以后,进入它的安装目录以下目录和简介不对应的是( C )A、/etc/httpd/conf # 配置文件路径B、/etc/httpd/conf/httpd.conf # 主配置文件C、/usr/lib64/httpd/ # 可执行文件路径D、/usr/sbin/ # 命令文件路径3、以下几个命令是启动httpd服务的是( A )。

      A、# service httpd startB、# /usr/local/apache-httpd/bin/apachectl startC、# apachectl -f /etc/httpd/httpd.confD、# service httpd stop4、httpd采用core + modules模块化设计方法,其中模块采用DSO(Dynamic Shared Object动态模块加载)的方式,具有MPM(Multipath Processing Module,多道处理模块)特性主要有那三种工作方式(ABC)A、preforkB、worker C、eventD、process5、以及对日志格式的描述不正确的是( D )A、远程主机IP:表明访问网站的是谁B、空白(E-mail):为了避免用户的邮箱被垃圾邮件骚扰,第二项就用“-”取代C、请求时间:用方括号包围,而且采用“公用日志格式”或者“标准英文格式” 时间信息最后的“+0800”表示服务器所处时区位于UTC之后的8小时D、方法+资源+协议:表示请求的状态一、简答题1、如何在你的Linux机器上安装Apache服务器?  答案 : 很简单, 你可以使用任何诸如(RHEL/CentOS/Fedora)上的yum以及(Debian/Ubuntu)上的apt-get来在你的Linux上安装Apache服务器.[root@tecmint ~]# yum install httpd[root@tecmint ~]# apt-get install apache22、Apache 以那个用户运行? 主配置文件的位置在哪里? 答案 : Apache 以“nobody”用户和httpd守护进程运行. Apache 主要的配置文件在: /etc/httpd/conf/httpd.conf (CentOS/RHEL/Fedora) 还有 /etc/apache2.conf (Ubuntu/Debian).3、如何在Apache中改变默认的端口,以及如何侦听其中的指令工作? 答案 : 在httpd.conf文件中有一个指令“Listen”可以让我们改变默认的Apache端口。

      在Listen 指令的帮助下我们可以在不同的端口还有不同的接口进行Apache侦听  假设你拥有多个IP注册到了你的Linux机器,并且想要Apache在一个特殊的以太网端口或接口接收HTTP请求, 即使是这种要求也可以用Listen指令做到  为了改变Apache的默认端口,请使用打开你的Apache主配置文件 httpd.conf 或者 apache2.conf [root@tecmint ~]# vi /etc/httpd/conf/httpd.conf[root@tecmint ~]# vi /etc/apache2/apache2.conf4、你知道Apache的DocumentRoot是啥意思么?  答案 : DocumentRoot 的 Apache 意思是服务器上web文件的存储位置, 默认的DocumentRoot是 /var/www/html 或者 /var/www. 这是可以被修改的,只要修改主机中的虚拟主机配置 “DocumentRoot”就行了5、启动httpd进程的用户为apache参考答案:修改以下的文件:vi /etc/httpd/conf/httpd.conf修改如下内容:User apacheGroup apache保存退出service httpd restart项目五一、简答题1、请解释Tomcat的默认端口是什么?Tomcat的默认端口是8080。

      在本地机器上初始化Tomcat之后,您可以验证Tomcat是否正在运行URL:http://localhost:80802、请解释将Tomcat作为一个Windows 服务运行会带来哪些好处?运行Tomcat作为windows服务带来了以下的好处:自动启动:对于需要在维护后远程重新启动系统的环境来说,这是至关重要的启动无活动用户登录的服务器:Tomcat通常在刀片服务器上运行,这些服务器甚至可能没有一个活动监视器,Windows服务可以在没有活动用户的情况下启动安。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.