Contrastive Chain-of-Thought (CCoT) Prompting

Contrastive Chain-of-Thought (CCoT) je metoda pro zvýšení argumentačních schopností velkých jazykových modelů (LLM).

Tato metoda zahrnuje poskytování ukázek správného i nesprávného uvažování, inspirovaných způsobem, jakým se lidé učí na základě správných i nesprávných metod.

Koncepce CCoT vychází z myšlenky, že přidání kontrastních příkladů, zahrnujících jak platné, tak neplatné uvažování, může výrazně zlepšit výkon LLM v úlohách uvažování.

Proces použití CCoT zahrnuje přípravu výzvy, poskytnutí platného vysvětlení myšlenkového řetězce (CoT), generování kontrastních neplatných vysvětlení CoT z platného a následné zavedení nové výzvy uživatele.

Následující obrázek ukazuje přehled kontrastního řetězce myšlenek (vpravo) s porovnáním s běžnými metodami promptingu.

Zdroje:

Navrhli Chia a kol. z DAMO, Singapore University of Technology and Desing a NTU Singapore v rámci Contrastive Chain-of-Thought Prompting.

VM

Napsat komentář Zrušit odpověď na komentář

Contrastive Chain-of-Thought (CCoT) Prompting

Související příspěvky:

VM

Napsat komentář Zrušit odpověď na komentář