關(guān)鍵詞:armv8 fft算法 fftw armpl simd優(yōu)化
摘要:FFT(快速傅里葉變換)是用于計(jì)算離散傅里葉變換(DFT)或其逆運(yùn)算的快速算法,它廣泛應(yīng)用于工程、科學(xué)和數(shù)學(xué)計(jì)算.到目前為止,鮮有基于ARM平臺(tái)的高性能FFT算法的實(shí)現(xiàn)和優(yōu)化,然而,隨著ARMv8處理器應(yīng)用的日益廣泛,研究FFT算法在ARM平臺(tái)上高性能實(shí)現(xiàn)日益重要.該文在ARMv8平臺(tái)上實(shí)現(xiàn)和優(yōu)化了一個(gè)高性能的多維FFT算法庫:PerfFFT,通過FFT蝶形網(wǎng)絡(luò)優(yōu)化、蝶形計(jì)算優(yōu)化、蝶形自動(dòng)生成、SIMD優(yōu)化、內(nèi)存對(duì)齊、cache-aware的分塊算法和高效轉(zhuǎn)置等優(yōu)化方法的應(yīng)用,顯著提升了FFT算法的性能.實(shí)驗(yàn)結(jié)果表明,PerfFFT相比目前應(yīng)用最為廣泛的開源FFT庫FFTW實(shí)現(xiàn)了10%~591%的性能提升,而相比ARM高性能商業(yè)庫ARM Performance Library實(shí)現(xiàn)了13%~44%的性能提升.
計(jì)算機(jī)學(xué)報(bào)雜志要求:
1.來稿要求論點(diǎn)明確,數(shù)據(jù),條理清晰,文字精練,字跡清楚.
2.為了使審理過程順利進(jìn)行,在投稿的同時(shí),作者需附一份關(guān)于文章所述工作的背景。將研究背景同文章放在同一個(gè)文件中,另起一頁。并且需向編輯部聲明:稿件內(nèi)容屬于作者的科研成果;署名無爭議;引用他人成果已注明出處;未公開發(fā)表過.
3.稿件首頁包括下列內(nèi)容:題目、真實(shí)姓名、詳細(xì)工作單位、城市及郵政編碼、200字的中文摘要和3-5條關(guān)鍵詞.文末附上稿件的英文文摘,包括英文題目、漢語拼音的姓名、工作單位的英文譯名、200個(gè)單詞以上的英文摘要和3-5條與中文關(guān)鍵詞對(duì)應(yīng)的英文關(guān)鍵詞.請(qǐng)將作者的Email、聯(lián)系地址、電話放在文章的首頁下方。
4.來稿必須做到清稿定稿.稿件中的外文字母必須分清大、小寫,正、斜體;上、下角的字母、數(shù)碼和符號(hào),其位置高低應(yīng)區(qū)別明顯;符號(hào)及時(shí)次出現(xiàn)時(shí)需要進(jìn)行說明。
5.文中的計(jì)量單位一律使用《中華人民共和國法定計(jì)量單位》.文中圖表只附必要的,插圖要精繪,圖中文字書寫清楚.插圖和照片不得用復(fù)印件,必須是清繪圖和原照片.圖、表應(yīng)貼在正文中的相應(yīng)位置上.圖、表和公式分別用阿拉伯?dāng)?shù)字全文統(tǒng)一編號(hào).
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社