
南开大学21秋《并行程序设计》平时作业2-001答案参考58.docx
12页南开大学21秋《并行程序设计》平时作业2-001答案参考1. 记并行时间为T,串行时间为T&39;,处理器数量为p,则额外开销应如何计算?( )A.T'-TB.T-T'C.pTD.pT-T'参考答案:D2. 一个Neon寄存器最多存放____个双精度浮点数一个Neon寄存器最多存放____个双精度浮点数A.2B.4C.8D.16参考答案:A3. 第一款桌面多核CPU是( )发布的A.IntelB.AMDC.IBMD.SUN参考答案:A4. 使用一个信号量实现“主线程等待4个从线程完成任务”,信号量初始值应设置为( )A.0B.1C.2D.4参考答案:A5. 在共享内存架构编程中,线程间不能通过_____进行通信A.全局变量B.局部变量C.静态变量D.全局堆中变量参考答案:B6. SSE intrinsics _mm_store_pd命令的功能是____SSE intrinsics _mm_store_pd命令的功能是____A.对齐向量存单精度浮点数B.未对齐标量存单精度浮点数C.对齐向量存双精度浮点数D.未对齐标量存双精度浮点数参考答案:C7. 当处理器数量不变时,随着问题规模增大,加速比____。
当处理器数量不变时,随着问题规模增大,加速比____A.所有算法都增大B.所有算法都减小C.代价最优算法都增大D.代价最优算法都减小参考答案:C8. 为防止编译器不支持OpenMP,应使用_____实现OpenMP代码和普通代码的条件编译A."#include "B."#pragma omp parallel"C."#ifdef _OPENMP"D."#define _OPENMP"参考答案:C9. 创建线程时,我们通过( )将线程号分别传递给每个线程A.全局变量B.局部变量C.动态分配变量D.pthread_create的“线程函数参数”参数参考答案:D10. 关于消息传递编程的特点,以下说法正确的是( )A.与共享内存一样有竞争条件B.编程简单C.需程序员考虑局部性D.无需考虑进程间通信参考答案:C11. 执行pthread_rwlock_rdlock时,( )的情况下加锁成功A.已有一个线程上了写锁B.已有多个线程上了写锁C.已有多个线程上了读锁D.已有多个线程上了读锁和写锁参考答案:C12. 当问题规模不变时,随着处理器数量增大,加速比_____A.必然增大B.必然减小C.必然不变D.以上皆错参考答案:D13. OpenMP循环并行指令是( )。
A.omp parallelB.omp singleC.omp parallel forD.omp master参考答案:C14. OpenMP并行模型是一种____模式OpenMP并行模型是一种____模式A.SISDB.SIMDC.MISDD.SPMD参考答案:D15. 主线程要求从线程退出应采用____主线程要求从线程退出应采用____A.pthread_createB.pthread_exitC.pthread_quitD.pthread_cancel参考答案:D16. 一个SSE寄存器可容纳( )个双精度浮点数A.2B.4C.8D.16参考答案:A17. 我国最早夺得全球超级计算机计算能力冠军的是( )A.天河1号B.天河1AC.天河2号D.神威.太湖之光参考答案:B18. 以下超级计算机中,____是SIMD架构以下超级计算机中,____是SIMD架构A.CRAY-1B.天河1AC.天河2号D.神威·太湖之光参考答案:A19. 一个SSE寄存器可容纳( )个短整型数A.2B.4C.8D.16参考答案:C20. 采用多核、众核技术提升CPU性能,相对于单核的优势不包括_____。
A.架构设计更容易B.更易突破物理极限C.能更充分利用现有资源D.功耗优势明显参考答案:B21. SSE intrinsics_mm_loadu_ps命令的功能是( )A.对齐向量读取单精度浮点数B.未对齐向量读取单精度浮点数C.对齐向量读取双精度浮点数D.未对齐向量读取双精度浮点数参考答案:B22. pthread_rwlock_rdlock是对读写锁进行_____操作A.加锁B.解锁C.加读琐D.加写锁参考答案:C23. 下面哪个问题相对而言更不适合进行数据并行_____A.求和B.排序C.向量加法D.矩阵乘法参考答案:B24. 在使用互斥量之后必须对其进行( )A.初始化B.加锁C.解锁D.销毁参考答案:D25. 对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____对一个串行程序进行SIMD并行化,应重点考虑的程序部分是____A.声明语句B.条件分支语句C.循环语句D.输入输出语句参考答案:C26. 求解同一个问题的4个并行算法的等效率函数分析结果如下,其中( )的可扩展性最优A.θ(plogp)B.θ(p^2)C.θ(p^2logp)D.θ(p^3)参考答案:A27. CPU时钟频率1GHz,每个时钟周期两个计算单元可执行4条指令,内存延迟125ns,进行向量点积运算,无cache情况下,计算能力为( )A.8MFlopsB.125MFlopsC.1GFlopsD.4GFlops参考答案:A28. CUDA的优点不包括____。
CUDA的优点不包括____A.可移植性B.入门简单C.标准的SPMD模式D.不再需要图形API参考答案:A29. 在使用信号量之前必须对其进行____在使用信号量之前必须对其进行____A.初始化B.加锁C.加1D.销毁参考答案:A30. 对两个互斥量a、b,线程1执行lock(a);lock(b);,线程2执行lock(b);lock(a),则两个线程间会发生____对两个互斥量a、b,线程1执行lock(a);lock(b);,线程2执行lock(b);lock(a),则两个线程间会发生____A.竞争条件B.数据依赖C.资源泄漏D.死锁参考答案:D31. 下列哪门课程不是并行程序设计的先导课?( )A.计算机概论B.高级语言程序设计C.计算机体系结构D.数据库系统参考答案:D32. OpenMP不会自动地在_____位置设置barrierA.并行结构开始B.并行结构结束C.其他控制结构开始D.其他控制结构结束参考答案:C33. 采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化采用划分子矩阵方法实现矩阵乘法,在进行SSE并行化时,是对(由外至内数)第____层循环进行循环展开然后向量化。
A.3B.4C.5D.6参考答案:D34. 对双精度浮点计算,AVX最高实现( )路并行A.2B.4C.8D.16参考答案:B35. n个元素排序问题,如果只能通过元素比较交换构造算法,则n个处理器的并行排序算法达到( )的运行时间才是代价最优的A.O(logn)B.O(n)C.O(nlogn)D.O(n2)参考答案:A36. 主线程创建了4个从线程然后打印一条信息,从线程打印各自的线程号,未使用任何同步,则主线程打印的消息和从线程打印的线程号的相对顺序_____A.必然主线程前、从线程后B.必然从线程前、主线程后C.必然相互交织D.各种顺序皆有可能参考答案:D37. 采用划分子矩阵技术优化矩阵乘法CUDA程序,子矩阵数组变量声明应加_____前缀A.__global__B.__device__C.__shared__D.__private__参考答案:C38. 加速比计算中串行时间应该取求解同一问题的哪个串行算法的时间_____A.任意一个串行算法B.作为并行算法基础的那个串行算法C.已知最优的串行算法D.所有串行算法的平均时间参考答案:C39. 任务依赖图中顶点权重之和表示( )。
A.任务数B.任务难度C.串行执行时间D.并行执行时间参考答案:C40. n个节点的超立方构造成本为( )A.OlognB.OsqrtnC.OnD.Onlogn参考答案:D41. 下面矩阵运算中,哪个进行简单的数据并行效果不佳_____A.矩阵求和B.矩阵相乘C.矩阵向量相乘D.高斯消去参考答案:D42. 如果运算对象是独立无关的变量,则在向量运算之前需_____A.将变量拷贝到连续区域B.将变量地址拷贝到连续区域C.将变量逐个传输到向量寄存器D.以上皆错参考答案:A43. 在SSE intrinsics程序中双精度浮点数数据类型是____在SSE intrinsics程序中双精度浮点数数据类型是____A.__m128B.__m128fC.__m128dD.__m128i参考答案:C44. SIMD架构未见于_____中SIMD架构未见于_____中A.多媒体扩展B.图形和游戏处理器C.计算机集群D.协处理器参考答案:C45. 在编写使用n个线程进行n个数求和的OpenMP的程序时采用临界区技术,则多线程版本_____串行版本A.肯定快于B.肯定慢于C.可能快于D.以上皆错参考答案:B46. 为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译。
为防止编译器不支持OpenMP,应使用____实现OpenMP代码和普通代码的条件编译A.“#include”B.“#pragma omp parallel”C.“#ifdef _OPENMP”D.“#define _OPENMP”参考答案:C47. 编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开编写矩阵乘法的SSE程序,若矩阵元素为单精度浮点数,则应对矩阵乘—加计算的循环进行____路循环展开A.2B.4C.8D.16参考答案:B48. 四位助教帮助教授批改300份试卷,试卷共16道题,每位助教负责批改所有试卷。
