Raspberry Pi4の性能評価(UnixBenchシングルCPU版)


Raspberry Pi4の性能評価(UnixBenchシングルCPU版)
Raspberry Pi4はRaspberry Pi3+と比較し大幅に性能が向上しました。CPUはCortex-A53からCortex-A72となり1.5倍程度性能が向上しています。メモリもLPDDR2からLPDDR4になり、速度が大きく向上しました。Raspberry Pi3+はメモリ容量が1GBでしたが、Raspberry Pi4は1GB/2GB/4GBから選択できるようになりました。そこで、今回はRaspberry Pi4、Raspberry Pi3+、Jeston nanoを使って性能比較を行います。Raspberry Pi4は以前の記事で紹介した無線LANを物理的に無効化したものを使います。

比較内容
今回の比較ではUnixBenchと呼ばれるLinux向けのベンチマークを利用します。UnixBnechでは基本的なCPU性能を計測することができます。単精度演算性能、浮動小数点演算性能、データコピー時の性能、OS動作(プロセス生成、パイプ処理等)時の性能を計測することができます。詳細な比較はできませんが、性能差の概要をつかむには十分だと言えます。また、本評価ではシングルCPUのみの性能を計測します。Raspberry Pi4は4コアCPUですが、そのうちの1コア分の性能になります。

比較するCPU
今回の比較ではRaspberry Pi4とRaspberry Pi3 B+, Jetson Nanoを比較します。また、参考としてXeonプロセッサも比較に加えます。Raspberry Pi4はメモリが1GBのものを利用します。下の表にそれぞれのスペックを示します。

Raspberry Pi4 Model B Raspberry Pi3 Model B+ Jetson Nano Xeon
SoC名 BCM2711 BCM2837B0 ?
CPU Quad-core ARM Cortex-A72 Quad-core ARM Cortex-A53 Quad-core ARM Cortex-A57 Xeon E5-2650 v2
CPU周波数 1.5 GHz 1.4GHz 1.43GHz 2.6GHz
メモリタイプ LPDDR4 LPDDR2 LPDDR4 DDR3
メモリ容量 1GB/2GB/4GB 1GB 4GB 16GB
ネットワーク 1Gbps 1Gbps(USB2.0経由のため480Mbpsが最大) 1Gbps 1Gbps
GPU名 VideoCore IV VideoCore IV 128-core Maxwell GPU Sapphire / RADEON RX 470 8G
GPU周波数 500MHz 400MHz 921MHz 926MHz
OS Raspbian(July 2019) Raspbian(July 2019) Ubuntu 18.04 LTS Ubuntu 16.04 LTS

 

結果
はじめにDhrystoneの結果です。Dhrystoneでは整数データを扱う演算の性能を比較することができます。

グラフは値が高いほど性能が良いことを示しています。ARM間で性能を比較するとJetson Nanoが最も高い性能となりました。RPi4はJetson Nanoと比較すると3割程度性能が低いことがわかります。また、XeonプロセッサはRPi4の3倍程度の性能となりました。

次にWhetstoneの結果です。Whetstoneでは倍精度の浮動小数点演算の性能比較を行うことができます。

浮動小数点演算性能はARMの中ではRPi4が最も高い結果となりました。Xeonの半分以上の性能です。Jetson NanoとRPi3Bは低い結果となりました。

次に、ファイルコピーの性能です。

この結果、Jetson NanoとRPi4は同程度の性能であると言えます。この2つはRPi3B+よりも高速です。しかしながらXeonと比較すると3倍近い性能差があることがわかります。

次にOS周りの性能について見ていきます。ここでは、Linuxプロセスを新しいLinuxプロセスに置き換えるexecl性能、簡単なプロセス間通信を行うPipe Throughput、コンテキストスイッチ性能を評価するPipe-based Context Switchingについて見てみます。

 

これらの評価ではJetson Nano, RPi3, RPi4は同程度の性能となりました。また、Xeonプロセッサと比較すると2割〜3割程度の性能であると言えます。

次に、Linuxプロセスの生成を行う際の性能(Process Creation)を示します。

プロセス生成の性能はARMの中ではRPi3とRPi4が同等の性能となりました。また、Jeston Nanoは最も性能が低いことがわかります。

次にSystem Call Overheadの結果を次に示します。本グラフのみ値が低いほうが良い結果となります。

その結果、RPi3B+は突出してSystem Callの性能が悪いことがわかります。

最後に、データコピーを行うシェルスクリプト実行時の性能を示します。


この結果、ARMではJetson Nanoが最も良い性能となりました。RPi4でShell Scriptを1つ実行した場合、Xeonの半分程度の性能が出ることがわかります。

まとめ
RPi4はRPi3B+と比較すると整数演算、浮動小数点演算性能が2倍程度高くなっていることがわかりました。計算量が多い処理を実行する場合、RPi3+をRPi4に置き換えることで性能向上が期待できます。一方で、ファイルのコピーやPipe処理、コンテキストスイッチ等の性能はRPi3+とRPi4は同程度の性能となりました。
RPi4とXeonを比較すると、RPi4はXeonの2割〜5割程度の性能を有しており、利用目的次第では十分な性能であることがわかりました。今回の評価は1コアでの比較でしたが、次はマルチコアでの評価を行います。


One Reply to “Raspberry Pi4の性能評価(UnixBenchシングルCPU版)”

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です