Zobrazeno 1 - 10
of 150
pro vyhledávání: '"thread block scheduling"'
Recent NVIDIA Graphics Processing Units (GPUs) can execute multiple kernels concurrently. On these GPUs, the thread block scheduler (TBS) uses the FIFO policy to schedule their thread blocks. We show that FIFO leaves performance to chance, resulting
Externí odkaz:
http://arxiv.org/abs/1406.6037
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
The Journal of Contents Computing. 2:165-173
Autor:
Sarita V. Adve, Matthew D. Sinclair, Muhammad Huzaifa, Johnathan Alsop, Giordano Salvador, Abdulrahman Mahmoud
Publikováno v:
ACM Transactions on Architecture and Code Optimization. 17:1-27
As GPUs have become more programmable, their performance and energy benefits have made them increasingly popular. However, while GPU compute units continue to improve in performance, on-chip memories lag behind and data accesses are becoming increasi
Publikováno v:
2021 IEEE Asia-Pacific Conference on Computer Science and Data Engineering (CSDE).
Conference
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Publikováno v:
IEEE Computer Architecture Letters. 16:127-131
Modern GPGPUs support the concurrent execution of thousands of threads to provide an energy-efficient platform. However, the massive multi-threading of GPGPUs incurs serious cache contention, as the cache lines brought by one thread can easily be evi
Publikováno v:
KIPS Transactions on Computer and Communication Systems. 6:219-230