HELM Fairness, Bias and Toxicity metrics

Course Q&A Generative AI with Large Language Models

DanielCogzell April 15, 2024, 9:40am 1

Hi there
In week 2, there is a lecture on the HELM benchmark. When I visit the HELM leaderboard page it is really difficult to interpret the results. Which metric(s) would speak to the Fairness, Bias and Toxicity of a model?

1 Like

Topic		Replies	Views
Lab 3, 3.3 Toxicity is worse after fine tuning according to metrics Generative AI with Large Language Models week-module-3	14	518	November 4, 2024
Week3-Lab3-Detoxification Generative AI with Large Language Models ai-discussions	2	47	September 16, 2024
2.3 Evaluate Toxicity - Fine-Tune FLAN-T5 to Generate More-Positive Summaries Generative AI with Large Language Models week-module-3	0	483	June 30, 2023
Lab 3, 2.2 Reward Model Generative AI with Large Language Models week-module-3	0	273	January 6, 2024
There is a typo Generative AI with Large Language Models feedback , week-module-2	1	345	November 17, 2023

HELM Fairness, Bias and Toxicity metrics

Related topics