好文档就是一把金锄头!
欢迎来到金锄头文库![会员中心]
电子文档交易市场
安卓APP | ios版本
电子文档交易市场
安卓APP | ios版本

南开大学21春《网络爬虫与信息提取》在线作业三满分答案78.docx

14页
  • 卖家[上传人]:夏**
  • 文档编号:476011227
  • 上传时间:2023-02-27
  • 文档格式:DOCX
  • 文档大小:14.19KB
  • / 14 举报 版权申诉 马上下载
  • 文本预览
  • 下载提示
  • 常见问题
    • 南开大学21春《网络爬虫与信息提取》作业三满分答案1. Scrapyd可以同时管理多个Scrapy工程里面的多个爬虫的多个版本 )T.对F.错参考答案:T2. Redis中的值可以支持( )A.列表B.哈希C.集合D.有序集合参考答案:ABCD3. 以下哪个HTML标签表示定义 HTML 表格中的行( )以下哪个HTML标签表示定义 HTML 表格中的行( )A.B.C.D.参考答案:C4. Python并导入uiautomator来操作设备的语句是from uiautomator import( )A.DeviceB.DevicesC.JobsD.Job参考答案:A5. lxml库中etree模块的( )方法把Selector对象转换为bytes型的源代码数据A.etree.tostringB.etree.convertBytesC.etree.toBytesD.etree.convertstring参考答案:A6. 下面关于Charles使用说法错误的是( )A.在数据包非常多的情况下,使用Charles的过滤功能来对数据包进行过滤从而减少干扰B.通过单击图中方框框住的各个选项卡,可以非常直观地观察到请求和返回的各种信息C.如果浏览器是Chrome,在没有安装第三方代理插件的情况下,Chrome的HTTP流量都会经过CharlesD.Charles无法支持计算机上除了浏览器之外的其他软件参考答案:D7. 以下哪个命令是利用URL语法在命令行下工作的文件传输工具( )以下哪个命令是利用URL语法在命令行下工作的文件传输工具( )A.curlB.tar -zxvfC.mkdirD.cp参考答案:A8. Charles能截获HTTP和HTTPS的数据包,如果网站使用websocket就可以截获。

      )A.正确B.错误参考答案:B9. Redis是( )数据库A.关系数据库B.键值数据库C.列存数据库D.图数据库参考答案:B10. 开源库pytesseract的作用是将图像中文字转换为文本 )A.正确B.错误参考答案:A11. PyMongo更新操作有( )A.updateB.update_allC.update_oneD.update_many参考答案:CD12. PyMongoDB中排序方法sort第二个参数1表示降序 )T.对F.错参考答案:F13. Python并导入uiautomator来操作设备的语句是from uiautomator import( )Python并导入uiautomator来操作设备的语句是from uiautomator import( )A.DeviceB.DevicesC.JobsD.Job参考答案:A14. 在发送请求时需要注意requests提交的请求头不能与浏览器的请求头一致,因为这样才能隐藏好自己达到获取数据的目的 )T.对F.错参考答案:F15. Python中哪种容器一旦生成就不能修改?( )A.列表B.元组C.字典D.集合参考答案:B16. 在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装。

      )在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装 )A.正确B.错误参考答案:B17. 以下表示请求正常处理的HTTP状态码为( )以下表示请求正常处理的HTTP状态码为( )A.200B.301C.404D.500参考答案:A18. Python可以将列表或字典转换成Json字符串 )T.对F.错参考答案:T19. Charles和Chrome开发者工具相比,只是多了一个搜索功能 )T.对F.错参考答案:F20. 下列关于mitmproxy的安装说法错误的是( )A.对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxyB.在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python3.5或者更高版本C.在windows系统中无法使用linux的命令,只能通过下载安装包来安装D.UBUNTU中执行命令 sudo pip3 installmitmproxy 进行安装参考答案:C21. 使用UI Automatorr操作实体键的命令为device.press.实体按键名称。

      )使用UI Automatorr操作实体键的命令为device.press.实体按键名称 )A.正确B.错误参考答案:A22. 如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱这是合法的 )如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱这是合法的 )A.正确B.错误参考答案:A23. requests中post请求方法的使用为requests.post(‘网址’, data=data)中的data为( )A.列表B.元组C.字典D.集合参考答案:C24. Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据 )Python中列表生成以后还可以往里面继续添加数据,也可以从里面删除数据 )A.正确B.错误参考答案:A25. 在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server )在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务 src/redis-server。

      )A.正确B.错误参考答案:B26. cookies在http请求中是明文传输的 )T.对F.错参考答案:T27. Python中定义函数关键字为( )A.defB.defineC.funcD.function参考答案:A28. 网络爬虫的用途有( )A.收集数据B.尽职调查C.提高流量D.攻击服务器参考答案:ABC29. 当运行爬虫代码后,出现“Forbidden by robots.txt”提示后,说明当前时间段被爬取的网站无法访问 )当运行爬虫代码后,出现“Forbidden by robots.txt”提示后,说明当前时间段被爬取的网站无法访问 )A.正确B.错误参考答案:B30. 当需要把Python里面的数据发送给网页时,应先将其转换成( )A.Json字符串B.GETC.POSTD.Request参考答案:A31. 参数headers=( ),把请求头添加到Scrapy请求中,使爬虫的请求看起来像是从浏览器发起的A.HEADERB.HEADERSC.HEADD.BODY参考答案:B32. 一个可行的自动更换代理的爬虫系统,应该下列哪些功能?( )A.有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中B.在发现某个请求已经被设置过代理后,什么也不做,直接返回C.在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用D.周期性验证数据库中的无效代理,及时将其删除参考答案:ACD33. Redis中的值可以支持( )Redis中的值可以支持( )A.列表B.哈希C.集合D.有序集合参考答案:ABCD34. robots.txt是一种规范,在法律范畴内。

      )robots.txt是一种规范,在法律范畴内 )A.正确B.错误参考答案:B35. 自动填充验证码的方式有( )自动填充验证码的方式有( )A.手动识别填写B.图像识别C.打码网站D.浏览器自动识别参考答案:BC36. Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含( )Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含( )A.列表B.元组C.字典D.集合参考答案:B37. 爬虫中间件的作用对象是请求request和返回response )爬虫中间件的作用对象是请求request和返回response )A.正确B.错误参考答案:B38. MongoDB中获取名字为set1的集合的语句为( )MongoDB中获取名字为set1的集合的语句为( )A.database.set1B.database('set1')C.database['set1']D.database{'set1'}参考答案:AC39. Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3。

      )A.正确B.错误参考答案:B40. charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任 )charles配置中,安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任 )A.正确B.错误参考答案:A41. process_spider_input(response,spider)是在爬虫运行yield item或者yield scrapy.Request( )的时候调用 )A.正确B.错误参考答案:B42. 带上通过Chrome浏览器从评论页面复制而来的( )再发起请求,可以减少爬虫被网站封锁的概率A.CookieB.HtmlC.HeadersD.CSS参考答案:C43. 如果很多爬虫同时对一个网站全速爬取,那么其实就是对网站进行了( )攻击A.XSSB.DOSC.DDOSD.跨域参考答案:C44. 以下哪些可以独立成为Python编译器( )以下哪些可以独立成为Python编译器( )A.PycharmB.IDLEC.EclipseD.V。

      点击阅读更多内容
      关于金锄头网 - 版权申诉 - 免责声明 - 诚邀英才 - 联系我们
      手机版 | 川公网安备 51140202000112号 | 经营许可证(蜀ICP备13022795号)
      ©2008-2016 by Sichuan Goldhoe Inc. All Rights Reserved.