实例解析-利用AIX工具进行性能调优

资源ID：266122705 资源大小：2.53MB 全文页数：26页
资源格式： DOCX 下载积分：15金贝

快捷下载

账号登录下载

微信登录下载

三方登录下载：

微信扫一扫登录

下载资源需要15金贝

邮箱/手机：
温馨提示：	快捷下载时，用户名和密码都是您填写的邮箱或者手机号，方便查询和重复下载（系统自动生成）。如填写123，账号就是123，密码也是123。
支付方式：
验证码：	换一换

账号：
密码：
验证码：	换一换
当日自动登录忘记密码？

1、金锄头文库是“C2C”交易模式，即卖家上传的文档直接由买家下载，本站只是中间服务平台，本站所有文档下载所得的收益全部归上传人（卖家）所有，作为网络服务商，若您的权利被侵害请及时联系右侧客服；
2、如你看到网页展示的文档有jinchutou.com水印，是因预览和防盗链等技术需要对部份页面进行转换压缩成图而已，我们并不对上传的文档进行任何编辑或修改，文档下载后都不会有jinchutou.com水印标识，下载后原文更清晰；
3、所有的PPT和DOC文档都被视为“模板”，允许上传人保留章节、目录结构的情况下删减部份的内容；下载前须认真查看，确认无误后再购买；
4、文档大部份都是可以预览的，金锄头文库作为内容存储提供商，无法对各卖家所售文档的真实性、完整性、准确性以及专业性等问题提供审核和保证，请慎重购买；
5、文档的总页数、文档格式和文档大小以系统显示为准(内容中显示的页数不一定正确)，网站客服只以系统显示的页数、文件格式、文档大小作为仲裁依据；
6、如果您还有什么不清楚的或需要我们协助，可以点击右侧栏的客服。

下载须知 | 常见问题汇总

1、会员注册 2、如何支付与充值 3、个人资料信息修改 4、我的收藏和“收藏文件夹” 5、我的读者群和加入读者群 6、我的书签 7、金锄头文库批量上传工具（绿色版）V1.0 8、下载文档（资源）相关问题整理 9、解决下载文档时，自动弹出迅雷的问题 10、下载时为什么支付不成功？

实例解析-利用AIX工具进行性能调优

实例解析：利用AIX工具进行性能调优 AIX 常见的系统跟踪工具 (tracing facilities) 包括 System trace ， lightweight memory trace (LMT), truss, component trace (CT), POSIX trace, 还有 Probevue 。在定位较深层次的系统性能问题时， System trace 以及基于 trace 的衍生工具（比如 tprof, curt, splat, filemon, netpmon 等等）往往非常有效。本文将基于实际案例，演示 System trace 用于性能分析的一些实际应用场景。1. 案例描述本案例为某行业的内存数据库应用，客户反馈的问题是写数据文件极慢，应用进程发生阻塞，阻塞时间可能长达十几秒。经过初步了解，应用的主要逻辑是将汇集的采样数据经过一系列的处理，最终保存至本地 SAS 盘上的数据文件。应用的 IO 采用 mmap 内存映射方式完成，在写文件时，会分配多个并发线程并各自分配固定的文件区域（配置为 4MB ），写满该区域之后再切换至新的文件区域。注意：为了保证客户数据隐私，作者根据客户业务逻辑完成了一个模拟程序，用于测试目的。本文所有使用的数据均为使用模拟程序获得。本例存储采用 SAS 本地盘作为文件存储介质，因此看到的性能数值偏低；使用存储应当能获得至少数倍以上性能提升。本文中涉及的命令多数在 ”IBM Power Systems Performance Guide Implementing and Optimizing” 中有涉及，相关选项细节可以自行参阅：1. 问题分析根据客户的场景描述，该应用的文件读写应当为顺序 IO 类型，且应用层平均 IO 大小为 4M 。属于比较典型的顺序 IO ，按通常的情况，即使写本地 SAS 盘，写带宽也应该能超过 100MBps ，但客户实际场景中带宽仅能达到十几兆字节每秒。查询文件系统所在的卷组的 LTG 大小为 256K ( 该参数可调，具体内容可以查阅参考文档【 1 】第 4.4.2 章 ) ，也就是说卷组支持的单次最大 IO*为*256K 。据此，如果应用的平均 IO 大小为 4M ，则系统上观察到的平均 IO 大小应当在 256K 左右。从实际观察的 IO 带宽看 (topas/iostat) ，实际平均 IO 只有 7.59M/1.52K 4.99K 左右 :从 iostat 的输出看也是如此：看到这里，很自然地需要确认应用是否的确是顺序 IO 类型。这需要对应用逻辑进行确认，重点是通过系统调用进行 IO 交互的部分逻辑。这部分工作可以通过查看应用源码进行，也可以通过系统跟踪工具（比如 trace/truss/probevue 等）来完成。先做一个简单的 truss 系统调用开销统计（ -c 选项进行统计， Ctrl+C 键终止统计）：可以看到应用确实使用的 mmap 映射 IO 方式读写文件。继续 truss 跟踪 mmap 、 munmap 、 msync 等相关的调用，可以发现应用刷新的 IO 块大小 (msync 的第二个参数 ) 为 4194304 = 4MB ，也符合客户对应用的描述。从 truss 的结果也能够看到，的确很多 msync 看起来很慢，比如截图中最后一个 msync*耗时达到了0.6974秒。*由于 truss D 看到的系统调用时间是较粗略的估计值，下面我们通过 curt 报告进行进一步确认，如下：可以看到， msync 调用的平均历时长达 2198.7598 毫秒。而该函数实际消耗的 CPU 时间仅为 4.8994 毫秒，说明绝大部分时间都处于等待 IO 完成的状态。抽取 imdb 的其中一个线程 56361101 ，检查其 trace report 报告：grep “ 56361101 “ trace.ascii > 56361101.txt可以看到，虽然 msync 一次刷新了 4MB 的页面，但实际对应到文件系统写时是大量的实际大小仅为 4K (bcount=0x1000) 的小块写操作，这应当是 msync 历时很长的根本原因：从 filemon 报告也能看到这一点：平均的每次写大小为 9.1 块，即 9.1 * 512 B = 4.55KB ，说明多数写大小仅为 1 页；同时高达99.9%的寻道比例说明IO类型为纯随机型IO：应用层 IO 大小为 4M 的顺序写，而实际观察到的系统层面磁盘 IO 为 4K 的随机写，这通常是 IO 碎片造成的。我们可以通过 fileplace 命令确认 JFS2 文件系统中的文件在磁盘上的分布情况，检查是否存在碎片：从 fileplace 命令输出看，该数据文件顺序性 (sequentiality) 的确极差 (7.9%) 。这应该是造成问题的根本原因。基System trace，生成trace report报告、curt报告和filemon报告的方法：采集 system trace:#trace -anf -T40000000 -L40000000 -C all -o ./trace.raw#sleep 20#trcstop生成 curt 报告：#curt -i ./trace.raw -ptes > curt.out生成 filemon 报告：#gensyms -F > gensyms.out#filemon -i ./trace.raw -n gensyms.out -O all,detailed -o filemon.out生成 trace report 报告：#trcrpt -Opid=on,tid=on,exec=on,svc=on,timestamp=1 ./trace.raw > trace.ascii注意：trace工具会带来一定系统开销，如需在生产环境使用，请事先联系IBM支持人员确认1. 解决方案进一步调查发现，客户应用创建了一个空文件，然后 ftruncate 成实际的大小 ( 例如 4GB) ；之后再以 mmap 方式映射到内存并写入内容。 8 个工作线程同时映射该文件，并发访问不同的文件区域。由于 ftruncate 并不实际分配文件存储空间，实际的空间分配是在 8 个工作线程写入到具体的区域才进行（ Allocation on Write ），由于多个并发写线程在时序上有重合，文件的多个区域并发分配，所以造成了严重的碎片问题。因此在访问 mmap 内存映射区域，不涉及物理 IO 的情况下，性能表现完全正常；一旦出现 msync ，就会造成长时间挂起。可行的解决方法有如下两类。解决方案 1 ：改变应用的文件预处理方式在应用创建数据文件时，提前完成初始化，避免写时分配，保证文件存储连续性。比如：#dd if=/dev/zero of=./m.txt bs=1M count=32#imdb 8优化后的文件块分配情况：在提前创建文件的情况下，文件本身存储在一段连续的文件块上，顺序性达到了 100% 。优化后实测 IO 带宽达到了 160MBps ，远远超过优化前不到 10MBps 的写带宽：curt 报告可以看到， msync 调用的平均历时有了明显的改善，从优化前的 2198.7598 毫秒，改善到目前的117.6793毫秒。msync 单次刷新的 IO 块大小也达到了 0x40000 = 256KB ，即 LTG 大小，符合预期的理想状态：filemon 报告看到的平均每次 IO 大小为 512blks ，即 256KB 。而 seek 比例也下降到 4.1% ，说明大多数 IO 为顺序型：解决方案 2 ：使用文件块更大的文件系统比如创建 blocksize 为 4MB 的 GPFS 文件系统，存放该数据文件。采用 GPFS 之后的文件块分布情况：实测优化后的IO写带宽达到了129MBps ，如下：curt 报告的 msync 性能也有明显改善：跟踪 mmfs 的 trace report ，也能看到 IO 块大小达到了 256K:从 filemon 看到的平均 IO 大小为 509.4 ，寻道比例为 3.8% 。整体表现略差于提前顺序初始化数据文件时的性能。修改后性能问题解决。说明：同样的程序在使用 xfs 文件系统的 linux 平台也有碎片现象，但由于 xfs 文件系统的空间分配策略不同，文件碎片问题不突出。 Linux 平台优化前后性能差别在 30%40% 左右，不及 AIX 差别显著。参考 Linux 平台优化前后的碎片情况。优化前：优化后：1. 附录测试步骤：#*./imdb <* *并发线程数*>*测试程序：/* The following enclosed code is sample code created by IPS* Corporation. This sample code is not part of any standard IPS product* and is provided to you solely for the purpose of demonstration.* The code is provided 'AS IS',* without warranty of any kind. IPS shall not be liable for any damages* arising out of your use of the sample code, even if they have been* advised of the possibility of such damages.*/*To compile: xlC_r imdb.cpp -o imdbProblem report: chenchihui*/#include #include #include #include #include #include #include #include #include #include #include #define MAXTHREADNUM 128#define INTERVAL 10000#define BUF_SIZE 4*1024*1024int testmmap(int arg)int fd = 0, n = 0, i = 0;timeval start, end;void *mp = NULL;struct stat sbuf;char idx = 0;long interval;int mplen = BUF_SIZE;if(fd = open("m.txt", O_RDWR, 0644) >= 0)fstat(fd, &sbuf);printf("file size = %dn", sbuf.st_size); elseprintf("open failedn"

注意事项

本文（实例解析-利用AIX工具进行性能调优）为本站会员（Baige****0346）主动上传，金锄头文库仅提供信息存储空间，仅对用户上传内容的表现方式做保护处理，对上载内容本身不做任何修改或编辑。若此文所含内容侵犯了您的版权或隐私，请立即阅读金锄头文库的“版权提示”【网址:https://www.jinchutou.com/h-59.html】，按提示上传提交保证函及证明材料，经审查核实后我们立即给予删除！

温馨提示：如果因为网速或其他原因下载失败请重新下载，重复下载不扣分。