Zobrazeno 1 - 8
of 8
pro vyhledávání: '"Hao, Shugang"'
Autor:
Hao, Shugang, Duan, Lingjie
Reinforcement learning from human feedback (RLHF) has become an essential step in fine-tuning large language models (LLMs) to align them with human preferences. However, human labelers are selfish and have diverse preferences. They may strategically
Externí odkaz:
http://arxiv.org/abs/2412.16834
Autor:
Hao, Shugang, Duan, Lingjie
Continual learning (CL) is a new online learning technique over sequentially generated streaming data from different tasks, aiming to maintain a small forgetting loss on previously-learned tasks. Existing work focuses on reducing the forgetting loss
Externí odkaz:
http://arxiv.org/abs/2412.16830
Autor:
Hao, Shugang, Duan, Lingjie
Today mobile crowdsourcing platforms invite users to provide anonymous reviews about service experiences, yet many reviews are found biased to be extremely positive or negative. The existing methods find it difficult to learn from biased reviews to i
Externí odkaz:
http://arxiv.org/abs/2306.06791
Autor:
Hao, Shugang, Duan, Lingjie
After upgrading to 5G, a network operator still faces congestion when providing the ubiquitous wireless service to the crowd. To meet users' ever-increasing demand, some other operators (e.g., Fon) have been developing another crowdsourced WiFi netwo
Externí odkaz:
http://arxiv.org/abs/2206.08261
Autor:
Hao, Shugang, Duan, Lingjie
Online content platforms are concerned about the freshness of their content updates to their end customers, and increasingly more platforms now invite and pay the crowd to sample real-time information (e.g., traffic observations and sensor data) to h
Externí odkaz:
http://arxiv.org/abs/1904.01841
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.
Akademický článek
Tento výsledek nelze pro nepřihlášené uživatele zobrazit.
K zobrazení výsledku je třeba se přihlásit.
K zobrazení výsledku je třeba se přihlásit.