PySpect

Home

Invoices

search

top

Package search

trl

Summary: Train transformer language models with reinforcement learning.
Author: Leandro von Werra
Homepage: https://github.com/huggingface/trl
Source: https://github.com/huggingface/trl
Repo profile
Number of releases: 58
First release: 0.0.1 on 2020-03-30T16:50:54
Latest release: 0.17.0 on 2025-04-24T23:18:40

Dependencies of trl (25).
Dependency	Optional
accelerate	false
datasets	false
rich	false
transformers	false
bitsandbytes	true
deepspeed	true
diffusers	true
fastapi	true
joblib	true
liger-kernel	true
llm-blender	true
mergekit	true
openai	true
parameterized	true
peft	true
Pillow	true
pydantic	true
pytest	true
pytest-cov	true
pytest-rerunfailures	true
pytest-xdist	true
requests	true
scikit-learn	true
uvicorn	true
vllm	true