Strona Glówna

Asystent AI

Wspieraj ten projekt

Prompty

Szukaj

Wkrótce

Czytaj źródło

View License

W trakcie weryfikacji przez człowieka

Data ostatniej aktualizacji:

29 sty 2023

Large Language Models are Zero-Shot Reasoners

Takeshi Kojima, Shixiang Shane Gu, Machel Reid, Yutaka Matsuo, Yusuke Iwasawa

Zapytaj o ten dokument AI

Kopuj link

Abstrakt

Kluczowe wnioski

Analiza dokumentu "Large Language Models are Zero-Shot Reasoners" (wprowadzającego słynną metodę Zero-Shot-CoT) pozwoliła na wyekstrahowanie kluczowych wniosków w kontekście strategii raportowania i inżynierii promptów:

Strategie z raportu

Zero-Shot Chain of Thought (Zero-Shot-CoT): Strategia pokazująca, że model nie potrzebuje gotowych przykładów rozwiązywania zadań (few-shot). Do aktywowania logicznego rozumowania i unikania błędów w złożonych zadaniach wystarczy zachęcić model do podzielenia procesu na kroki za pomocą tzw. frazy wyzwalającej.

Objaśnienie lub prompt

"Oblicz ile jabłek ma Tomek, jeśli na początku miał 15, zjadł 3, a potem kupił dwa razy więcej niż mu zostało. Pomyślmy o tym krok po kroku."

Wieloetapowe Promptowanie (Two-Stage Prompting): Proces polegający na logicznym rozdzieleniu etapu myślenia od etapu generowania wyniku. W pierwszym etapie model generuje analizę, a w drugim system zmusza go do wyodrębnienia samej odpowiedzi, co jest kluczowe w automatyzacji zadań.

Objaśnienie lub prompt

"Biorąc pod uwagę powyższe rozumowanie, ostateczna odpowiedź (zapisana tylko cyframi) to:"

Odkrywanie utajonej wiedzy (Latent Knowledge Extraction): Raport dowodzi, że gigantyczne modele językowe posiadają głęboką wiedzę i zdolności wnioskowania. Strategią jest testowanie odblokowania ich za pomocą trybu zero-shot, zanim deweloper ucieknie się do kosztownego "douczania" modelu (fine-tuningu).

Objaśnienie lub prompt

"Zanim podasz mi rozwiązanie, rozłóż ten problem na mniejsze części i wyjaśnij swój proces myślowy krok po kroku."

Dobre praktyki

Stosowanie pojedynczych, uniwersalnych szablonów (Single Prompt Template): Raport pokazuje, że stosowanie jednej ogólnej frazy wyzwalającej "Let's think step by step" dla różnych typów zadań (matematyka, logika, gry słowne) daje świetne rezultaty bez konieczności personalizacji zapytania do konkretnego problemu.

Objaśnienie lub prompt

"Zadanie: [dowolna treść trudnego problemu inżynieryjnego]. Let's think step by step."

Tworzenie prostej linii bazowej (Minimal Baseline): Zawsze rozpoczynaj testowanie wydajności modelu od techniki Zero-Shot-CoT. Często pozwala to uzyskać bardzo silne, zadowalające rezultaty, dzięki czemu unikniesz zbędnego, ręcznego rzeźbienia wielu przykładów w prompcie.

Objaśnienie lub prompt

"Czy zdanie 'Każdy trójkąt jest kwadratem' to prawda? Przeanalizujmy to najpierw krok po kroku."

Rozdzielenie toku rozumowania i odpowiedzi: Zawsze zmuszaj model do pokazania swojej ścieżki dedukcji. Dzięki temu nie tylko zwiększasz poprawność odpowiedzi modelu, ale też ułatwiasz sobie ewentualne debugowanie i wskazanie, w którym miejscu AI popełniło błąd.

Objaśnienie lub prompt

"Pomyśl krok po kroku na głos. Na samym końcu, w osobnej linijce napisz 'WYNIK: [twoja ostateczna odpowiedź]'."

Czego unikać?

Wymuszania bezpośrednich odpowiedzi na złożone problemy (Direct Answer Prompting): Unikaj zadawania trudnych zadań z jednoczesnym wymogiem natychmiastowego podania wyniku. Bez wbudowanego procesu myślenia model często generuje błędne domysły.

Objaśnienie lub prompt

"Rozwiąż to zadanie: 42 * 13 / 2 i podaj mi natychmiast tylko ostateczny wynik."

Zbyt szybkiego polegania na "Few-Shot Prompting": Unikaj inwestowania czasu w tworzenie specjalnych przykładów wewnątrz promptów, zanim nie sprawdzisz trybu Zero-Shot-CoT. Badania dowodzą, że modele gorzej radzą sobie z kilkoma źle dobranymi przykładami, niż z jednym poleceniem "krok po kroku".

Objaśnienie lub prompt

Ręczne dopisywanie do promptu 3 różnych zadań logicznych z rozwiązaniami, podczas gdy zadziałałoby po prostu: "Pomyśl krok po kroku."

Przeładowywania instrukcji uruchamiających rozumowanie: Zbyt szczegółowe instrukcje, o to jak model ma myśleć, mogą sprawić, że AI pogubi się w ich wypełnianiu zamiast faktycznie rozwiązać zadanie.

Objaśnienie lub prompt

"Wygeneruj łańcuch myśli, który będzie zawierał co najmniej 5 akapitów dedukcyjnych, gdzie każdy opisuje jedną zmienną, a potem prowadzi do werdyktu."

Wesprzyj ten projekt stawiając mi kawę ;)

5 zł

10 zł

15 zł

Publikacje AI

Prompting

Bezpieczeństwo AI

O mnie

Mój blog

Wsparcie projektu

Buy me a coffe

Create by Mateusz Jędraszczyk