Raspberry Pi4の性能評価(UnixBenchシングルCPU版)
Raspberry Pi4の性能評価(UnixBenchシングルCPU版)
Raspberry Pi4はRaspberry Pi3+と比較し大幅に性能が向上しました。CPUはCortex-A53からCortex-A72となり1.5倍程度性能が向上しています。メモリもLPDDR2からLPDDR4になり、速度が大きく向上しました。Raspberry Pi3+はメモリ容量が1GBでしたが、Raspberry Pi4は1GB/2GB/4GBから選択できるようになりました。そこで、今回はRaspberry Pi4、Raspberry Pi3+、Jeston nanoを使って性能比較を行います。Raspberry Pi4は以前の記事で紹介した無線LANを物理的に無効化したものを使います。
比較内容
今回の比較ではUnixBenchと呼ばれるLinux向けのベンチマークを利用します。UnixBnechでは基本的なCPU性能を計測することができます。単精度演算性能、浮動小数点演算性能、データコピー時の性能、OS動作(プロセス生成、パイプ処理等)時の性能を計測することができます。詳細な比較はできませんが、性能差の概要をつかむには十分だと言えます。また、本評価ではシングルCPUのみの性能を計測します。Raspberry Pi4は4コアCPUですが、そのうちの1コア分の性能になります。
比較するCPU
今回の比較ではRaspberry Pi4とRaspberry Pi3 B+, Jetson Nanoを比較します。また、参考としてXeonプロセッサも比較に加えます。Raspberry Pi4はメモリが1GBのものを利用します。下の表にそれぞれのスペックを示します。
Raspberry Pi4 Model B | Raspberry Pi3 Model B+ | Jetson Nano | Xeon | |
SoC名 | BCM2711 | BCM2837B0 | ? | |
CPU | Quad-core ARM Cortex-A72 | Quad-core ARM Cortex-A53 | Quad-core ARM Cortex-A57 | Xeon E5-2650 v2 |
CPU周波数 | 1.5 GHz | 1.4GHz | 1.43GHz | 2.6GHz |
メモリタイプ | LPDDR4 | LPDDR2 | LPDDR4 | DDR3 |
メモリ容量 | 1GB/2GB/4GB | 1GB | 4GB | 16GB |
ネットワーク | 1Gbps | 1Gbps(USB2.0経由のため480Mbpsが最大) | 1Gbps | 1Gbps |
GPU名 | VideoCore IV | VideoCore IV | 128-core Maxwell GPU | Sapphire / RADEON RX 470 8G |
GPU周波数 | 500MHz | 400MHz | 921MHz | 926MHz |
OS | Raspbian(July 2019) | Raspbian(July 2019) | Ubuntu 18.04 LTS | Ubuntu 16.04 LTS |
結果
はじめにDhrystoneの結果です。Dhrystoneでは整数データを扱う演算の性能を比較することができます。
グラフは値が高いほど性能が良いことを示しています。ARM間で性能を比較するとJetson Nanoが最も高い性能となりました。RPi4はJetson Nanoと比較すると3割程度性能が低いことがわかります。また、XeonプロセッサはRPi4の3倍程度の性能となりました。
次にWhetstoneの結果です。Whetstoneでは倍精度の浮動小数点演算の性能比較を行うことができます。
浮動小数点演算性能はARMの中ではRPi4が最も高い結果となりました。Xeonの半分以上の性能です。Jetson NanoとRPi3Bは低い結果となりました。
次に、ファイルコピーの性能です。
この結果、Jetson NanoとRPi4は同程度の性能であると言えます。この2つはRPi3B+よりも高速です。しかしながらXeonと比較すると3倍近い性能差があることがわかります。
次にOS周りの性能について見ていきます。ここでは、Linuxプロセスを新しいLinuxプロセスに置き換えるexecl性能、簡単なプロセス間通信を行うPipe Throughput、コンテキストスイッチ性能を評価するPipe-based Context Switchingについて見てみます。
これらの評価ではJetson Nano, RPi3, RPi4は同程度の性能となりました。また、Xeonプロセッサと比較すると2割〜3割程度の性能であると言えます。
次に、Linuxプロセスの生成を行う際の性能(Process Creation)を示します。
プロセス生成の性能はARMの中ではRPi3とRPi4が同等の性能となりました。また、Jeston Nanoは最も性能が低いことがわかります。
次にSystem Call Overheadの結果を次に示します。本グラフのみ値が低いほうが良い結果となります。
その結果、RPi3B+は突出してSystem Callの性能が悪いことがわかります。
最後に、データコピーを行うシェルスクリプト実行時の性能を示します。
この結果、ARMではJetson Nanoが最も良い性能となりました。RPi4でShell Scriptを1つ実行した場合、Xeonの半分程度の性能が出ることがわかります。
まとめ
RPi4はRPi3B+と比較すると整数演算、浮動小数点演算性能が2倍程度高くなっていることがわかりました。計算量が多い処理を実行する場合、RPi3+をRPi4に置き換えることで性能向上が期待できます。一方で、ファイルのコピーやPipe処理、コンテキストスイッチ等の性能はRPi3+とRPi4は同程度の性能となりました。
RPi4とXeonを比較すると、RPi4はXeonの2割〜5割程度の性能を有しており、利用目的次第では十分な性能であることがわかりました。今回の評価は1コアでの比較でしたが、次はマルチコアでの評価を行います。
One Reply to “Raspberry Pi4の性能評価(UnixBenchシングルCPU版)”