Zobrazeno 1 - 10
of 31
pro vyhledávání: '"Kwon, Yongkee"'
Autor:
Seo, Minseok, Nguyen, Xuan Truong, Hwang, Seok Joong, Kwon, Yongkee, Kim, Guhyun, Park, Chanwook, Kim, Ilkon, Park, Jaehan, Kim, Jeongbin, Shin, Woojae, Won, Jongsoon, Choi, Haerang, Kim, Kyuyoung, Kwon, Daehan, Jeong, Chunseok, Lee, Sangheon, Choi, Yongseok, Byun, Wooseok, Baek, Seungcheol, Lee, Hyuk-Jae, Kim, John
Publikováno v:
ASPLOS 2024
Accelerating end-to-end inference of transformer-based large language models (LLMs) is a critical component of AI services in datacenters. However, diverse compute characteristics of end-to-end LLM inference present challenges as previously proposed
Externí odkaz:
http://arxiv.org/abs/2410.15008
Autor:
Kim, Donghyuk, Kim, Jae-Young, Han, Wontak, Won, Jongsoon, Choi, Haerang, Kwon, Yongkee, Kim, Joo-Young
Processing-in-memory (PIM) architecture is an inherent match for data analytics application, but we observe major challenges to address when accelerating it using PIM. In this paper, we propose Darwin, a practical LRDIMM-based multi-level PIM archite
Externí odkaz:
http://arxiv.org/abs/2305.13970
Near-data accelerators (NDAs) that are integrated with main memory have the potential for significant power and performance benefits. Fully realizing these benefits requires the large available memory capacity to be shared between the host and the ND
Externí odkaz:
http://arxiv.org/abs/1908.06362
Training convolutional neural networks (CNNs) requires intense computations and high memory bandwidth. We find that bandwidth today is over-provisioned because most memory accesses in CNN training can be eliminated by rearranging computation to bette
Externí odkaz:
http://arxiv.org/abs/1810.00307
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Autor:
Kwon, Yongkee
In computer systems, latency tolerance is the use of concurrency to achieve high performance in spite of high latency. Existing techniques to tolerate long memory latencies include data prefetching, out-of-order instruction execution, and multithread
Externí odkaz:
https://explore.openaire.eu/search/publication?articleId=doi_________::aab8a40d9d495fdeeaa09c2c5f58a660
Autor:
Kwon, Daehan, Lee, Seongju, Kim, Kyuyoung, Oh, Sanghoon, Park, Joonhong, Hong, Gi-Moon, Ka, Dongyoon, Hwang, Kyudong, Park, Jeongje, Kang, Kyeongpil, Kim, Jungyeon, Jeon, Junyeol, Kim, Nahsung, Kwon, Yongkee, Kornijcuk, Vladimir, Shin, Woojae, Won, Jongsoon, Lee, Minkyu, Joo, Hyunha, Choi, Haerang, Kim, Guhyun, An, Byeongju, Lee, Jaewook, Ko, Donguc, Jun, Younggun, Kim, Ilwoong, Song, Choungki, Kim, Ilkon, Park, Chanwook, Kim, Seho, Jeong, Chunseok, Lim, Euicheol, Kim, Dongkyun, Jang, Jieun, Park, Il, Chun, Junhyun, Cho, Joohwan
Publikováno v:
IEEE Journal of Solid-State Circuits; January 2023, Vol. 58 Issue: 1 p291-302, 12p
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.