
南开大学21春“计算机科学与技术”《网络爬虫与信息提取》离线作业(三)辅导答案2.docx
6页长风破浪会有时,直挂云帆济沧海 她南开大学21春“计算机科学与技术”《网络爬虫与信息提取》离线作业(三)答案一.综合考核(共50题)1.Cookies一般包含在请求头Headers中)T.对F.错参考答案:T2.以下哪个命令是利用URL语法在命令行下工作的文件传输工具()A.curlB.tar -zxvfC.mkdirD.cp参考答案:A3.Python中列表可以用()方法在末尾添加元素A.addB.appendC.plusD.+参考答案:B4.以下哪些方法属于Python写CSV文件的方法?()A.writeheadersB.writeheaderC.writerrowsD.writerow参考答案:ACD5.cookies的缺点是()A.实现自动登录B.跟踪用户状态C.http中明文传输D.增加http请求的流量参考答案:CD6.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()。
A.列表B.元组C.字典D.集合参考答案:C7.PyMongo中逻辑查询表示小于的符号是()A.$gtB.$ltC.$gte$$lte参考答案:B8.使用UI Automatorr操作实体键的命令为device.press.实体按键名称)A.正确B.错误参考答案:A9.所有的异步加载都会向后台发送请求)T.对F.错参考答案:F10.当需要把Python里面的数据发送给网页时,应先将其转换成()A.Json字符串B.GETC.POSTD.Request参考答案:A11.HTTP状态码503表示服务器内部故障)T.对F.错参考答案:F12.在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server)A.正确B.错误参考答案:B13.Charles能截获HTTP和HTTPS的数据包,如果网站使用websocket就可以截获)A.正确B.错误参考答案:B14.Python中把列表转换为集合需要使用()函数A.setB.listC.convertD.change参考答案:A15.一般来说在页面都通过GET将用户登录信息传递到服务器端。
)A.正确B.错误参考答案:B16.()是Scrapy官方开发的,用来部署、运行和管理Scrapy爬虫的工具A.ScrapydB.ScrapyDeployC.DeployD.Scrapy_Deploy参考答案:A17.使用Nginx反向代理到Scrapyd以后,Scrapyd本身只需要开通内网访问即可,不许经过输入密码)A.正确B.错误参考答案:A18.数据抓包就是中间人爬虫的一个简单应用所以使用Charles也是一种中间人攻击)T.对F.错参考答案:T19.Robo 3T与RoboMongo是完全不一样的软件)A.正确B.错误参考答案:B20.Python中的容器有()A.列表B.元组C.字典D.集合参考答案:ABCD21.Redis中往集合中读数据,使用关键字()A.popB.spopC.lpopD.range参考答案:B22.Python并导入uiautomator来操作设备的语句是from uiautomator import()A.DeviceB.DevicesC.JobsD.Job参考答案:A23.当需要把Python里面的数据发送给网页时,应先将其转换成()A.Json字符串B.GETC.POSTD.Request参考答案:A24.下面Python代码输出为:()def default_para_without_trap(para=[],value=0):if not para:para=[]para.append(value)return para print(‘第一步:{}’.format(default_para_trap(value=100))) print(‘第二步:{}’.format(default_para_trap(value=50)))A.第一步:[100]第二步:[100,50]B.第一步:[100]第二步:[50]C.第一步:[100]第二步:[]D.第一步:[100]第二步:[100]参考答案:B25.以下哪些可以独立成为Python编译器()A.PycharmB.IDLEC.EclipseD.Visual Studio 2010参考答案:AB26.最常见的HTTP请求类型有()A.GETB.POSTC.SENDD.RECEIVE参考答案:AB27.requests中post请求方法的使用为requests.post(‘网址’, data=data)中的data为()。
A.列表B.元组C.字典D.集合参考答案:C28.mitmproxy的强大之处在于它还自带一个mitmdump命令这个命令可以用来运行符合一定规则的Python脚本)A.正确B.错误参考答案:A29.xpath中extract方法返回值类型是()A.列表B.元组C.字典D.集合参考答案:A30.使用BeautifulSoup对象后可以使用()来查找内容A.find_allB.findC.searchD.search_all参考答案:AB31.Python中()与元组由类似的数据读取方式A.字符串B.列表C.字典D.集合参考答案:AB32.charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任)A.正确B.错误参考答案:A33.scrapy与selenium结合可以实现直接处理需要异步加载的页面)T.对F.错参考答案:T34.process_spider_input(response, spider)是在爬虫运行yield item或者yield scrapy.Request()的时候调用)T.对F.错参考答案:F35.以下表示请求正常处理的HTTP状态码为()A.200B.301C.404D.500参考答案:A36.Python中若定义object=(1,2,3,4,5),则print(object[::3])输出()。
A.345B.34C.45D.123参考答案:C37.MongoDB中获取名字为db的库的语句为()A.client.dbB.client('db')C.client['db']D.client{'db'}参考答案:AC38.PyMongo中逻辑查询表示不等于的符号是()A.$gtB.$ltC.$eqD.$ne参考答案:C39.Python操作CSV文件可通过()容器的方式操作单元格A.列表B.元组C.字典D.集合参考答案:C40.下列关于在IOS上配置charles的说法正确的是()A.不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口B.和电脑需要在同一个局域网下C.HTTP代理可以使用“自动”选项D.安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动参考答案:BD41.Redis的列表是一个单向队列)T.对F.错参考答案:F42.以下HTTP状态码表示服务器本身发生错误的是()A.400B.503C.302D.500参考答案:BD43.MongoDB中数据存储的形式类似于()A.列表B.元组C.字典D.集合参考答案:C44.使用xpath方法的返回类型是()A.列表B.元组C.字典D.集合参考答案:A45.Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库。
)T.对F.错参考答案:T46.Redis若要进入交互环境,需要打开终端输入()A.redis-cliB.redisC.redis-cmdD.redis-start参考答案:A47.MongoDB是一个关系数据库产品)A.正确B.错误参考答案:B48.device.sleep()方法是使用UI Automatorr关闭屏幕的命令)A.正确B.错误参考答案:A49.使用UI Automatorr让屏幕向右滚动的操作是得到相应控件后使用命令scroll.horiz.forward())T.对F.错参考答案:F50.爬虫的源代码通过公开不会对被爬虫网站造成影响)A.正确B.错误参考答案:B。
