Biała księga

Pułapka B+: Jak sztuczna inteligencja ogranicza spektrum kreatywności

Systemy sztucznej inteligencji szkolone metodą RLHF są systematycznie nagradzane za generowanie wyników, które osiągają wysokie wyniki w średniej preferencji ludzkiej — co matematycznie popycha je w kierunku kreatywnej przeciętności. Niniejszy artykuł definiuje pułapkę B+, identyfikuje RLHF jako mechanizm strukturalny i proponuje ramy Rebel AI oparte na poszukiwaniu nowości, przeciwstawnych agentach dywergencyjnych i metapoznawczej informacji zwrotnej.

DOI:
10.13140/RG.2.2.10486.46403
Jest to tekst wewnątrz bloku div.

Tytuł publikacji