買這商品的人也買了...
-
$414Java 虛擬機精講 -
$414自己動手寫Java虛擬機 -
$774揭秘 Java 虛擬機 : JVM 設計原理與實現 -
UVM 實戰$594$564 -
Verilog HDL 數字系統設計與驗證 — 以太網交換機案例分析$354$336 -
$594芯片設計 CMOS 模擬集成電路版圖設計與驗證 : 基於 Cadence IC 617 -
FPGA 設計與驗證$474$450 -
AI 證券投資分析:探索超額報酬 ─ 使用 Excel 實作【暢銷回饋版】$650$507 -
SoC 設計方法與實現, 4/e$479$455 -
$403畢昇編譯器原理與實踐 -
WebGL 建構網頁中的 3D遊戲 從基礎渲染原理、光影到應用$980$774 -
$891AI 量化投資 -
完全 OS 核心精修 - 熟稔 Windows API 高級篇$1,280$1,011 -
$658數字 SoC 設計、驗證與實例 -
最強 AI 投資分析:打造自己的股市顧問機器人,股票趨勢分析×年報解讀×選股推薦×風險管理$750$593 -
一本精通 - AI 繪圖奧義$720$569 -
萬顆 GPU 的訓練 - 分散式機器學習 — 系統工程與實戰$1,280$1,011 -
$485集成電路設計 — 模擬、版圖、綜合、驗證及實踐 -
AI 繪圖夢工廠 + 社群玩家特典:Midjourney、Stable Diffusion、Copilot、Leonardo.Ai、Adobe Firefly 超應用神技$680$578 -
汽車電子硬件設計$894$849 -
$327AI Agent:AI 的下一個風口 -
從CPU到SoC的設計與實現 :基於高雲雲源軟件和FPGA硬件平臺$474$450 -
無料 AI:ChatGPT + Gemini + Claude + Copilot + Coze + PlaygroundAI + Ideogram + Stylar + Faceswapper + Suno + Stable Audio + D-ID + Runway + Sora + Gamma-「文字、繪圖、動漫、視覺、音樂、影片、簡報」創意無限 (第二版)$680$537 -
自動駕駛的大腦 - 車載晶片技術開發及詳解$1,200$948 -
深度學習 -- 最佳入門邁向 AI 專題實戰, 2/e$1,200$948
商品描述
Ralf Karrenberg presents Whole-Function Vectorization (WFV), an approach that allows a compiler to automatically create code that exploits data-parallelism using SIMD instructions. Data-parallel applications such as particle simulations, stock option price estimation or video decoding require the same computations to be performed on huge amounts of data. Without WFV, one processor core executes a single instance of a data-parallel function. WFV transforms the function to execute multiple instances at once using SIMD instructions. The author describes an advanced WFV algorithm that includes a variety of analyses and code generation techniques. He shows that this approach improves the performance of the generated code in a variety of use cases.
商品描述(中文翻譯)
Ralf Karrenberg 提出了整體函數向量化(Whole-Function Vectorization, WFV)的方法,這種方法允許編譯器自動生成利用 SIMD 指令的數據並行代碼。數據並行應用程序,如粒子模擬、股票期權價格估算或視頻解碼,需要對大量數據執行相同的計算。如果沒有 WFV,則一個處理器核心僅執行數據並行函數的單一實例。WFV 轉換該函數,使其能夠同時執行多個實例,利用 SIMD 指令。作者描述了一種先進的 WFV 算法,該算法包括多種分析和代碼生成技術。他展示了這種方法在多種使用案例中提高了生成代碼的性能。
