在线时间:8:00-16:00
迪恩网络APP
随时随地掌握行业动态
扫描二维码
关注迪恩网络微信公众号
1. Linux下,如何看每个CPU的使用率: #top -M 之后按下数字1. (或者top之后按1也一样)则显示多个CPU 的信息,和内存信息: [root@testpc ~]# top -M top - 15:38:40 up 2 days, 2:05, 2 users, load average: 0.00, 0.00, 0.00 Tasks: 138 total, 1 running, 137 sleeping, 0 stopped, 0 zombie Cpu0 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Cpu1 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Cpu2 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Cpu3 : 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 3725.047M total, 263.312M used, 3461.734M free, 45.711M buffers Swap: 8095.992M total, 0.000k used, 8095.992M free, 55.977M cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 1 root 20 0 19228 1512 1224 S 0.0 0.0 0:00.61 init 2 root 20 0 0 0 0 S 0.0 0.0 0:00.00 kthreadd 2. 在Linux下,如何确认是多核或多CPU: #cat /proc/cpuinfo 如果有多个类似以下的项目,则为多核或多CPU: processor : 0 ...... processor : 1 3. 如何察看某个进程在哪个CPU上运行: #top -d 1 之后按下f.进入top Current Fields设置页面: 选中:j: P = Last used cpu (SMP) 则多了一项:P 显示此进程使用哪个CPU。 Sam经过试验发现:同一个进程,在不同时刻,会使用不同CPU Core.这应该是Linux Kernel SMP处理的。 4. 配置Linux Kernel使之支持多Core: 内核配置期间必须启用CONFIG_SMP选项,以使内核感知 SMP。 Processor type and features ---> Symmetric multi-processing support 察看当前Linux Kernel是否支持(或者使用)SMP #uname -a 5. Kernel 2.6的SMP负载平衡: 在 SMP 系统中创建任务时,这些任务都被放到一个给定的 CPU 运行队列中。通常来说,我们无法知道一个任务何时是短期存在的,何时需要长期运行。因此,最初任务到 CPU 的分配可能并不理想。 为了在 CPU 之间维护任务负载的均衡,任务可以重新进行分发:将任务从负载重的 CPU 上移动到负载轻的 CPU 上。Linux 2.6 版本的调度器使用负载均衡(load balancing) 提供了这种功能。每隔 200ms,处理器都会检查 CPU 的负载是否不均衡;如果不均衡,处理器就会在 CPU 之间进行一次任务均衡操作。 这个过程的一点负面影响是新 CPU 的缓存对于迁移过来的任务来说是冷的(需要将数据读入缓存中)。 记住 CPU 缓存是一个本地(片上)内存,提供了比系统内存更快的访问能力。如果一个任务是在某个 CPU 上执行的,与这个任务有关的数据都会被放到这个 CPU 的本地缓存中,这就称为热的。如果对于某个任务来说,CPU 的本地缓存中没有任何数据,那么这个缓存就称为冷的。 不幸的是,保持 CPU 繁忙会出现 CPU 缓存对于迁移过来的任务为冷的情况。 6. 应用程序如何利用多Core : 开发人员可将可并行的代码写入线程,而这些线程会被SMP操作系统安排并发运行。 另外,Sam设想,对于必须顺序执行的代码。可以将其分为多个节点,每个节点为一个thread.并在节点间放置channel.节点间形如流水线。这样也可以大大增强CPU利用率。 例如: 游戏可以分为3个节点。 1.接受外部信息,声称数据 (1ms) 2.利用数据,物理运算(3ms) 3.将物理运算的结果展示出来。(2ms) 如果线性编程,整个流程需要6ms. 但如果将每个节点作为一个thread。但thread间又同步执行。则整个流程只需要3ms. |
请发表评论