do concurent の可搬性
この3社は自前の CPU / GPU 用の Fortan コンパイラを提供していますが、CPU を持たない Nvidia が Fortran 標準文法の do concurrent を GPU 対応にすることを始めてうまくいっているようなので、Intel / AMD も後を追いかけ始めているようです。AMD はこの論文の調査時点ではイマイチなようですが、新バージョンが最近出たのでまた事情が違うかもしれません。
Portability of Fortran's `do concurrent' on GPUs. https://t.co/4cOyGjVtKR
— Mathematical Software Papers (@GFNCL) 2024年12月25日
読むのもだるいので Google Notebook LM にぶち込んで要約してもらいました。 男女の対話への変換は、22分の対話になりました。アニメ1話分w
https://notebooklm.google.com/
その一部の引用
NVIDIA、Intel、AMDのGPUベンダー間でHipFTを構築および実行する方法について説明します。 NVIDIAは、GPUオフロード用のDC実装が最も成熟しています。Intelのifxコンパイラは最近、DC GPUオフロードのサポートを追加しましたが、自動メモリ管理システムがないため、GPUとCPU間のデータ転送によるパフォーマンスの低下を避けるために、OpenMPターゲットのenter/exitデータディレクティブのペアを使用してメモリを手動で管理する必要があります。AMD GPUへのDCオフロードのサポートは最近のもので、現在の実装はHPEのCray Compiler Environment (CCE)によって提供されています。CCEは現在、ユニファイドメモリアーキテクチャ用のDC AMD GPUオフロードのみをサポートしています。
なお、Intel の一般民生品の Arc シリーズが意外と性能が良いらしいです。