holarissun

Follow

🎯

Focusing

Hao Sun holarissun

🎯

Focusing

Follow

PhD in Reinforcement Learning, LLM Alignment, RLHF

51 followers · 30 following

University of Cambridge
https://holarissun.github.io/
@HolarisSun

Achievements

BetaSend feedback

Achievements

BetaSend feedback

Highlights

Pro

Block or Report

Block or report holarissun

Report abuse

Contact GitHub support about this user’s behavior. Learn more about reporting abuse.

Pinned

Prompt-OIRL Prompt-OIRL Public

code for paper Query-Dependent Prompt Evaluation and Optimization with Offline Inverse Reinforcement Learning

Python 25 5
PanelGPT PanelGPT Public

We introduce new zero-shot prompting magic words that improves the reasoning ability of language models: panel discussion!

Python 96 8
RewardShifting RewardShifting Public

Code for NeurIPS 2022 paper Exploiting Reward Shifting in Value-Based Deep RL

Python 23 1
PCHID_code PCHID_code Public

Code for [NeurIPS'2019 Spotlight] Policy Continuation with Hindsight Inverse Dynamics

Jupyter Notebook 15
YangRui2015/AWGCSL YangRui2015/AWGCSL Public

Code for ICLR 2022 paper Rethinking Goal-Conditioned Supervised Learning and Its Connection to Offline RL.

Python 27 2
Accountable-Offline-RL Accountable-Offline-RL Public

Code for NeurIPS 2023 paper Accountability in Offline Reinforcement Learning: Explaining Decisions with a Corpus of Examples

Python 4 1